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INTRODUCTION 


Jusqu’au debut des annees 1980, l’econometrie s’est developpee a un 
rythme relativement lent. Elle avait beaucoup de mal a se liberer du 
paradigme statistique classique. Mais avec la poussee fulgurante de 
l’informatique, l’econometrie a connu un essor fort appreciable ces 
vingt demieres annees. Que l’on pense simplement a la multiplication 
effrenee des modeles econometriques non lineaires, des modeles de 
volatilite et des nouvelles techniques d’estimation comme le GMM ou 
la methode des moments simules, pour ne nommer que quelques 
nouveaux champs de 1’econometrie contemporaine. 

Mais ce qui est encore plus saisissant, c’est l’avancee au pas de 
charge de l’econometrie dans le domaine de la theorie financiere. En 
effet, la theorie des produits derives, qui prend sa source au debut des 
annees 1970, fait de plus en plus appel aux modeles econometriques 
de volatilite, tels les modeles GARCH, et a la methode du GMM pour 
estimer les parametres des equations differentielles stochastiques qui 
servent a la determination des prix des options, entres autres. L’eco¬ 
nometrie a egalement permis au modele du CAPM, bien connu en 
theorie financiere, de s’afffanchir de son cadre statique. On peut main- 
tenant parler de betas variables dans le temps et la transposition de 
l’approche GARCH au CAPM a permis de le situer dans un cadre 
multivarie. La finance corporative emprunte egalement de plus en plus 
a l’econometrie. Ainsi, l’analyse des investissements des entreprises 
dans un contexte d’incertitude donne lieu a la formulation d’equations 
differentielles stochastiques dont 1’estimation des parametres exige le 
recours a l’econometrie, entre autres a la methode econometrique du 
GMM. 
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2 Traite d’econometrie financiere 


L’incursion de Peconometrie dans le domaine de la finance a 
donne lieu a l’apparition d’une nouvelle discipline: Peconometrie 
financiere. L’econometre financier, en plus de maitriser Peconometrie 
moderne, doit disposer de bases solides en theorie financiere de fagon 
a pouvoir operer une symbiose des deux disciplines que sont Pecono¬ 
metrie et la finance. La formation de P econometre financier est done 
tres exigeante. Le present Traite d’econometrie financiere s’attaque a 
cette discipline complexe en visant a exposer au lecteur les fonde- 
ments de Peconometrie financiere. Les applications des methodes 
econometriques presentees dans notre Traite seront done tirees de la 
theorie financiere moderne. 

II n’existe pas a notre avis de manuel redige en frangais qui se soit 
donne notre objectif. Du fait de l’importance de plus en plus grande 
de la finance empirique, notre Traite vient combler une grave lacune 
qui existe encore aujourd’hui au sein des outils pedagogiques a la 
disposition des etudiants de la finance et de l’economie financiere. II 
vise la clientele des etudiants de troisieme annee du baccalaureat 
specialise en finance ou en economie financiere et des etudiants des 
divers programmes de MBA, de maitrise en finance appliquee ou de 
DESS en finance. II s’adresse egalement au specialiste de la finance - 
analyste financier, gestionnaire de portefeuille, ingenieur financier - 
qui souhaite effectuer un tour d’horizon complet et rigoureux de 
Peconometrie financiere moderne. 

Tout en se voulant une introduction a Peconometrie financiere 
moderne, notre Traite d’econometric financiere vise egalement a appro- 
fondir certains domaines-clefs de cette discipline, parfois juges com¬ 
plexes par Petudiant, comme les modeles GARCH et le GMM. Dans 
son souci de rigueur, notre Traite fournit tres souvent au lecteur les 
preuves des diverses formules qui y apparaissent. Dans son souci 
pedagogique, notre Traite renferme egalement des chapitres ou sec¬ 
tions consacres a des rappels de la statistique ou du calcul matriciel. 

Voici un bref survol de notre Traite d’econometrie financiere. Le 
chapitre 1 porte sur des rappels de notions statistiques de base qui 
sont utilisees par la suite dans notre manuel. On y expose, entre 
autres, une version etoffee de la methode d’estimation du maximum 
de vraisemblance. Les chapitres 2 et 3 sont les chapitres classiques de 
tout manuel d’econometrie. Ils presentent le modele lineaire a deux 
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Introduction 3 


variables et le modele lineaire general. Les chapitres 4 et 5 ont trait a 
des variations sur les modeles lineaire et non lineaire. Y sont pre¬ 
sents, entre autres: le modele des moindres carres non lineaires et le 
modele Box-Cox; les tests J et RESET; le test de Chow; une intro¬ 
duction a la theorie asymptotique; les tests LM, LR et de Wald; une 
introduction a la theorie des variables instrumentales et au pheno- 
mene de la multicollinearite. 

Le chapitre 6 se penche sur les methodes numeriques utilisees en 
econometrie. On y aborde la simulation de Monte Carlo, la technique 
dite du bootstrapping et celle du kernel. On y montre incidemment 
comment evaluer le prix d’une option asiatique a partir d’une simula¬ 
tion de Monte Carlo. Les chapitres 7 et 8 s’attardent aux problemes 
econometriques classiques de 1’heteroscedasticite et de l’autocorrela- 
tion des erreurs residuelles. Le chapitre 9 concerne la theorie 
econometrique des series temporelles. Y font figure les processus 
stochastiques, les modeles ARMA et ARIMA, les previsions a l’aide de 
series chronologiques, les tests de racines unitaires et le phenomene 
de la cointegration. 

Le chapitre 10 dirige son collimateur sur un probleme statistique 
important dans le domaine des series financieres: l’lieteroscedasticite 
conditionnelle. Une attention particuliere est accordee aux modeles 
ARCH, ARCH-M, GARCH, EGARCH et TARCH. La prevision 
des series chronologiques dans un contexte d’heteroscedasticite con- 
ditionnelle y est etudiee. Linalement, les applications que contient ce 
chapitre concernent le modele financier du CAPM. On y montre 
entres autres comment estimer le modele du CAPM dans le cadre 
d’un modele GARCH multivarie. 

Linalement, le chapitre 11 s’attaque a la methode des moments 
generalises, dont l’acronyme est: GMM. Nous y demontrons comment 
cette technique d’estimation integre les modeles classiques d’estima- 
tion: modele des moindres carres lineaires, des doubles moindres 
carres et du maximum de vraisemblance. Comme application de la 
methode du GMM, nous estimons les parametres du modele stochas- 
tique de taux d’interet de Schaefer et Schwartz dans un contexte 
canadien. 


© 2001 - Presses de l’Universite du Quebec 
Edifice Le Delta I, 2875, boul. Laurier, bureau 450, Quebec, Quebec G1V 2M2 • Tel.; (418) 657-4399 - 



4 Traite d’econometrie financiere 


L’econometrie financiere est une discipline captivante. A en juger 
par devolution acceleree qu’elle connait depuis vingt ans, elle est 
appelee a un brillant avenir. Nous esperons que le lecteur partagera, 
au fil de la lecture des chapitres de notre Traite cTeconometrie financiere, 
notre tres vif interet pour cette nouvelle discipline. 
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CHAPITRE 


1 

RAPPELS STATISTIQUES 1 


Ce chapitre vise a presenter les principaux outils probabilistes et 
statistiques qui sont essentiels a la comprehension de ce Traite d’econo- 
metrie financiere. Nous presentons dans un premier temps les notions 
de variables aleatoires et de modeles probabilistes en temps discret et 
continu. Les modeles probabilistes regroupent les principales lois de 
probability en temps discret, soit les distributions binomiale et de 
Poisson, et les lois de probability en temps continu, soit les lois 
normales univariee et bivariee, le chi-carre, le t de Student, le F de 
Fisher, la loi uniforme. Dans un second temps, nous nous penchons 
sur les moments de certaines distributions et sur le theoreme central 
limite. L’estimation de certains de ces moments, entre autres par la 
methode des moindres carres ordinaires et celle du maximum de vrai- 
semblance, est abordee. Leurs intervalles de confiance sont calcules. 


1. Notion de variable aleatoire 

II existe deux definitions pour une variable aleatoire, l’une heuris- 
tique, l’autre basee sur la theorie de la mesure. Selon la defintion 


1. Les references des chapitres 1 et 2 sont les suivantes: Amemiya, T. (1994), 
Introduction to Statistics and Econometrics, Harvard University Press, Cambridge, 
Massachusetts; Baillargeon, G. et J. Rainville (1979), Statistique appliquee, tomes 1 
et 2, 5 e edition, Editions SMG, Trois-Rivieres; Judge, G.G. et al. (1988), Intro¬ 
duction to the Theory and Practice of Econometrics, 2 e edition, Wiley, New York; 
Kendall’s Advanced Theory of Statistics (1999), Arnold, London; Rao, C.R. (1973), 
Linear Statistical Inference and Its Applications, 2 e edition, John Wiley and Sons, 
New York. 
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6 Traite d’econometrie ftnanciere 


heuristique, une variable aleatoire est une variable qui prend des 
valeurs suivantune certaine fonction de distribution 2 . Dans sa version 
formelle, une fonction a valeur reelle X(.) definie sur l’espace (ft, |3, P) 
est appelee variable aleatoire (ou mesurable dans le langage de la 
theorie de la mesure) si 1’ensemble {«: X(co) < x} £ (3 pour tout x dans 
91 ou le triplet (II, p, P) est appele espace probabiliste, II etant defini 
comme 1’espace echantillonnal et p etant 1’ensemble de Borel. Un 
ensemble de Borel est une famille de sous-ensembles contenant tous 
les evenements de la droite des reels pour lesquels on peut calculer 
une probabilite de realisation. Formellement, on appelle aussi p une 
u-algebre. Pour sa part, P est une mesure de probabilite sur p. 
Done, on peut voir la fonction X(.) comme une application de 11 a 91: 

fl -49t 3 . 

On distingue les variables aleatoires continues et discretes. Par 
exemple, les realisations de l’indice S&P’s 500 aux Etats-Unis et du 
TSE 300 au Canada font partie des variables aleatoires continues, car 
elles peuvent prendre n’importe quelle valeur dans 1’ensemble des reels. 
Les variables dichotomiques font partie de 1’ensemble des variables 
aleatoires discretes. Par exemple, emettre ou ne pas emettre un divi- 
dende est un exemple de variable dichotomique. On donnerait la 
valeur 1 lorsqu’il y a emission de dividende et 0 autrement. 

On distingue egalement les variables deterministes des variables 
aleatoires. Une variable y* t = f(x t ), ou x t est connu et parfaitement 
controle, est dite deterministe et done parfaitement previsible. Par 
exemple, si f(x t ) = mx t +b, alors y* t =mx t +b. On peut illustrer 
cette relation par la figure 1.1. 

On observe sur cette figure que pour une valeur donnee de x, la 
valeur de y est automatiquement determinee. Connaissant la valeur de 
x, on peut done prevoir parfaitement la valeur de y. II existe des 
formes beaucoup plus complexes de variables deterministes. Par 
exemple, dans la theorie du chaos deterministe, les formes fonction- 
nelles sont de nature hautement non lineaire, mais elles nous amenent 


2. La notion de fonction de distribution sera definie ulterieurement. 

3. Pour des details additionnels, voir: Rao, C. (1973), Linear Statistical Inference and 
Its Applications, John Wiley and Sons, New York. 
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Rappels statistiques 7 


a la prevision exacte de certains phenomenes physiques 4 . Tel n’est pas 
le cas pour une variable aleatoire. Une variable definie comme: 
y t = f fx t ) + e t , ou e t est une variable aleatoire IID 5 (0, a 2 ) y t etant la 
somme d’une fonction non stochastique et d’une composante alea¬ 
toire (stochastique) est done une variable aleatoire. 


Figure 1.1 



La figure 1.2 represente la fonction: y t = b + mx t +e t • y t peut 
prendre plusieurs valeurs pour une valeur donnee de x t . Ceci est du a 
la presence du terme aleatoire e t dans la fonction de y t . y t n’etant plus 
previsible parfaitement, mais seulement a l’interieur d’un intervalle de 
confiance, il s’agit done d’une variable aleatoire. 


4. Les exemples classiques de fonctions de variables deterministes en physique 
sont: la tent map, la logistic map et le modele du chaos deterministe de Makey et 
Glass (1977) qui a servi, entre autres, a modeliser la reproduction des cellules 
rouges du sang. A ce sujet, on consultera egalement: Racicot, F.E. (2000), Notes 
on Nonlinear Dynamics, document de travail, CRG, 16-2000, ESG, UQAM. 

5. HD pour «identiquement et independamment distribue ». 
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8 Traite d’econometrie financiere 


Figure 1.2 



2. Statistiques descriptives 

A une variable aleatoire donnee sont associees plusieurs statistiques 
descriptives. Dans ce qui suit, nous analysons les plus utilisees en 
finance empirique. 

2.1. Mesure de la tendance centrale 
d'une variable aleatoire 

Soit une variable aleatoire X et ses realisations x f e {xi, ..., xt}. Alors 
la moyenne des realisations se delink comme suit: 

- ii 

T 

Supposons maintenant que l’on ait plusieurs variables aleatoires: 
Xi e {Xi, ...,Xt} ou les X; ~IID(m, ct 2 ), ou m est la moyenne de la 
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population et s 2 , sa variance. Alors l’estimateur X est dit sans biais si 
E E (X,) Til 

E(x) = —-=-= p. Le biais de X se definit comme suit: 


biais(X) = E(x)-p 

D’autres mesures de la tendance centrale sont la mediane et le 
mode. La mediane se definit comme etant la valeur qui separe l’echan- 
tillon en deux. Si le nombre d’observations est impair, la mediane est 

N + l 

egale a: -. Pour sa part, le mode est la valeur la plus frequente 

observee dans un echantillon. Soulignons que la mediane fait figure 
d’estimateur robuste de la tendance centrale en ce sens qu’elle ne 
depend pas de la normalite d’une distribution, contrairement a la 
moyenne qui, elle, depend de cette hypothese. En effet, si la distribu¬ 
tion echantillonnale differe de la normale, la moyenne est alors un 
mauvais estimateur de la tendance centrale, ce qui n’est pas le cas de 
la mediane. 


2.2. Mesures de dispersion d'une variable aleatoire 

Nous voulons calculer la variance echantillonnale, mesure de disper¬ 
sion de cet echantillon, designee par s 2 . Pour les realisations Xj de X, 
celle-ci est egale a: 

IM 2 

s 2 = —- 

T-l 

Supposons, comme dans le cas precedent, que l’on ait plusieurs 
variables aleatoires: Xj e {Xi, ..., Xt} ou les Xj ~ IID (p, ct 2 ), ou p est 
la moyenne de la population et s 2 , sa variance. Alors l’estimateur S 2 est 

Efx.-x ) 2 

dit sans biais si: S 2 = —- et E(S 2 1 = a 2 . 6 

T-l V ’ 


6. La preuve de cette formule est donnee a 1’annexe de ce chapitre. 
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L’ecart-type est designe par . Intuitivement, s 2 peut etre vu 
comme une moyenne d’ecarts par rapport a la moyenne au carre, le 
carre eliminant les signes negatifs de cette moyenne. Cette statistique 
nous donne 1’etendue d’une distribution. Pour un petit ecart-type, 
les observations seront concentrees autour de la moyenne alors que 
dans le cas d’un grand ecart-type, elles seront plus dispersees. Les 
figures 1.3 et 1.4 illustrent les distributions empiriques associees a un 
petit ecart-type et a un grand ecart-type. 


Figure 1.3 



Figure 1.4 
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Une autre mesure de la variability des realisations d’une variable 
aleatoire est le coefficient de variation, designe par CV. II se definit 
comme suit pour la variable X: 

CV = -^xlOO 

x 

Si l’on veut comparer la variability des realisations de deux variables 
aleatoires X et Y, on recourt au CV de chacune de ces variables pour 
pallier le probleme de Pechelle des mesures. En effet, supposons que 
sxsoit egal a 3,6 et sy , a 631,4, on pourrait etre porte a croire que Y 
est plus variable que X, la variability etant mesuree par 1’ecart-type. 
Tel n’est pas le cas puisqu’il y a ici un probleme d’unite de mesure: la 
variable X est mesuree en pourcentage (p. ex., le taux d’interet) et la 
variable Y, en dollars (p. ex., le volume des transactions boursieres). 
On peut remedier a ce probleme en degonflant sx et sy par leur 
moyenne respective: x est egal a 8,8 ety a 2915,3. Les coefficients 
respectifs de variation pour X et Y sont de 0,409 et de 0,217. On 
realise done apres coup que X est plus variable que Y sur la base du 
coefficient de variation meme si, a priori, on concluait l’inverse. Comme 
autre exemple, on peut noter que les variables mesurees en millions de 
dollars sont plus volatiles en termes absolus que celles mesurees en 
unites de dollars, ce qui n’est pas le cas sur une base relative, qui 
s’obtient en divisant ces variables par leur moyenne respective. 

2.3. Mesure du degre d'asymetrie et d'aplatissement 
d'une distribution empirique 

2.3.1. Le coefficient d'asymetrie ( skewness) 

Ce coefficient mesure le degre d’asymetrie d’une distribution. II se 
definit comme suit: 


E [^( x )] = L^( x ) f ( x ) dx 

ou E(.) est l’esperance et V(.), la variance. E, dans les petits echan- 
tillons, est estime par la moyenne arithmetique des realisations de la 
variable aleatoire: 
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£( Xi -x) J 

ou (jl est estime par x. 

Eh -) 2 

Par ailleurs, on estime o 2 par a 2 = —-. 

T 

Si = 0, alors la distribution est symetrique, a 1’instar de la 
a 3 

normale, qui apparait a la figure 1.5. 

Figure 1.5 



Notons que dans le cas d’une distribution normale, tous les 
moments impairs sont nuls. 

Si — > 0, alors la densite de la distribution est concentree vers 
a 3 

la droite, comme le montre la figure 1.6. 
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Figure 1.6 



Si —^ < 0, alors la densite de la distribution est concentree vers 
a 3 

la gauche, comme le montre la figure 1.7. 


Figure 1.7 



L’intuition ici est que l’on compare les moments empiriques de 
nos donnees aux moments theoriques d’une distribution qui est la 
distribution normale. 
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2.3.2. Le coefficient d'aplatissement (Kurtosis) 

Comme son nom 1’indique, le coefficient d’aplatissement d’une distri¬ 
bution mesure son degre d’aplatissement. II est associe a l’epaisseur 
des queues {tails) de la distribution. On le definit comme suit: 

m e[ ( x ~^ )4 ] e^x-h) 4 ] 

(v(x )) 2 = (o ') 2 

Dans la pratique on estime ce coefficient de la fagon suivante. 
L’esperance E est estimee par la moyenne echantillonnale, c’est-a- 
dire: 


EE -*) 4 

E [(x-,r] s iL _ =A4 

ou (x et ct 2 sont estimes comme ci-devant. 

Si = 3, il n’y a pas de biais leptocurtique. On dit alors que la 
a 4 

distribution est mesocurtique comme c’est le cas pour la distribution 

normale qui sert de point de reference. Par ailleurs, si > 3, on est 

a 4 

confronte au cas d’une distribution leptocurtique. Plus commune- 
ment, on dit qu’une telle distribution presente des queues epaisses, 
toujours en rapport avec les extremites d’une distribution normale, 
comme on peut le constater a la figure 1.8. 

Finalement, si < 3, on parle alors de distribution platicur- 
a 4 

tique. Plus communement, on dit qu’une telle distribution presente 
des queues minces {thin tails), toujours en rapport avec les extremites 
d’une distribution normale, comme on peut le constater a la figure 1.9. 
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Figure 1.8 



Figure 1.9 



Si les coefficients estimes d’asymetrie et d’aplatissement sont 
respectivement pres de 0 et de 3 pour une distribution donnee, on 
pourrait conclure qu’on est en presence d’une distribution gaussienne 
(normale). Certains logiciels tres connus comme EViews, SAS et 
RATS sont deja preprogrammes pour le calcul de ces coefficients. 
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Comme c’est toujours le cas en statistdque, un seul coup d’oeil 
graphique ne suffit pas a mesurer les deviations de ces coefficients par 
rapport a la normale. Comme a l’accoutumee, il faut developper un 
test pour juger du caractere significatif de ces deviations. Le test de 
Jarque et Bera (1984) est congu a cette fin. Ce test est defini sur la 
somme des coefficients d’asymetrie et d’aplatissement eleves au carre. 
Plus precisement, le test de Jarque et Bera est base sur la statistdque 
suivante: 


JB = ^^^AS 2 +^-(KUR-3) 2 j^ 2 (2) 

ou AS est le coefficient d’asymetrie et KUR, le coefficient de kurtosis. 

Le test d’hypotheses est le suivant. L’hypothese nulle HO est que 
la distribution est normale alors que 1’hypothese alternative HI est 
que la distribution n’est pas normale. La regie consiste a rejeter HO si 
JB est plus grand que x 2 avec deux degres de liberte au seuil de 
signification habituel de 5 % ou si la p-value associee a la statistdque JB 
est inferieure a 0,05. Une mise en garde vis-a-vis I’utilisation de ce test 
s’impose cependant. Ce test est asymptotique comme l’indique le 
symbole ~ dans la formule de JB. Ce test n’est done pas exact parce 
que l’on ne connait pas la distribution de JB dans de petits echantil- 
lons. On ne connait sa distribution que dans les grands echantillons 7 . 
On peut effectuer directement ce test de normalite dans le logiciel 
EViews. 


7. Si Ton regressait les y sur X, on obtiendrait le vecteur e = y - Xp. Pour tester la 
normalite des erreurs residuelles, on calcule les inputs de la formule de JB 

„ Ee! . y>i Eef 

comme suit: li. = —;u + = - —;o = —. Ce test fait partie de la cate- 

T T T 

gorie des tests LM. Notons que l’on pourrait aussi le voir comme un test de Wald. 
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2.4. Test de Kolmogorov-Smirnov 8 (K-S) 

Ce test est utilise pour comparer une distribution empirique a une 
distribution donnee. Ce test peut notamment servir de test de norma- 
lite. La statistique reliee au test de K-S, designee par D, se calcule 
comme suit: 


D = maxJS N ( x )- p ( x )| 

ou Sn( x ) est un echantillon de donnees et P(x) est une cdf 9 connue. La 
representation graphique des variables du test apparait a la figure 1.10. 


Figure 1.10 



8. Cette section s’inspire du livre suivant: Press, W.H. et al. (1989), Numerical 
Recipes: The Art of Scientific Computing (FORTRAN Version), Cambridge Univer¬ 
sity Press, Cambridge (reproduit avec la permission de l’editeur). 

9. cdf est l’abreviation de cumulative distribution function. 
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Sur cette figure, D est la statistique de K-S. La distribution 
empirique des valeurs de x, soit le graphique de Sn(x), est comparee a 
une distribution theorique ou la densite de probability cumulee est 
representee par P(x). Sn(x) est une fonction par paliers qui augmente 
d’un montant identique pour chaque observation mesuree. La valeur 
de D represente la plus grande distance entre ces deux distributions 
cumulees, soit Sn(x) et P(x). Pour le cas ou il y a deux fonctions de 
distribution cumulatives d’observations differentes, Sni(x) et Sn 2 (x), la 
statistique K-S s’ecrit: 


D = _maxJS N i (x) - S N2 (x)| 


Les hypotheses a tester sont les suivantes. HO : les deux distribu¬ 
tions sont identiques; HI : les deux distributions sont differentes. 
Pour ce faire, il faut calculer le caractere significatif de D (p-value ), 



represente le iiombre d’observations. 

Dans le cas ou l’on compare deux distributions, le niveau de 
signification se calcule comme suit: Prob (D > valeur observee) = 



remarquer que ce test est asympototique 


mais en pratique, on peut considerer que N = 20 est un seuil tolerable, 
d’autant plus si le degre de conservatisme est important (seuil de 
signification de 0,01 ou moins). 

3. Modeles probabilistes 

3.1. Lois de probability discretes univariees 

3.1.1. La fonction de distribution et de repartition 

Rappelons d’abord les statistiques descriptives associees aux lois de 
probability discretes univariees. La distribution d’une variable alea- 
toire discrete qui rend compte de ses probabilites de realisation peut 
etre representee par la figure en batonnets 1.11. 
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FIGURE 1.11 Distribution discrete de X 


f(x) = p(X = x) 

f(x 3 ) 

ffe) 

f(xi) 


La probabilite que X soit plus petit ou egal a x est representee par: 
P(X < x) = F(x) = (x), ou F(.) est la fonction de repartition (pro- 

X<x 

babilite cumulative). La representation de la probabilite cumulative 
apparait a la figure 1.12. 

Notons sur cette figure que les probabilites se cumulent a mesure 
que les Xj augmentent puisque la fonction F(xj) est la probabilite de 
realisation jusqu’a Xj. Par exemple F(x 3 ) = f(xj) + f(x 2 ) + f(x 3 ) = 1. 
Voici quelques proprietes de ces distributions. 

i) FH = £f( Ii )-liF(—) = 0 

ii) Si x > y, => F(x) > F(y) 

iii) P^Xj < X < Xj j = F^Xj j - F(xj_j). Par exemple, 

P(x 2 <X<x 4 ) = F(x 4 )-F( Xl ) 
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iv) P( Xi <X) = l-P(X< Xi ) 

v) P( Xi <X< Xi ) = f( Xi ) 


FIGURE 1.12 Fonction de repartition 

F(x) 


F(xj) = 1 


3.1.2. Esperance et variance en discret 
L'esperance 

L’esperance mathematique pour une variable aleatoire discrete se 
definit comme suit: 

E ( X ) = L f ( x i) x i ouf(x i ) = P(X = x i ) 

Plus generalement, E[g(x)] = ^ g(x ; ) f (xj). Par exemple, dans 
le cas precedent: g(xd = xj. L’esperance mathematique est done la 
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moyenne ponderee des realisations de la variable aleatoire X sur la 
population, les facteurs de ponderation etant les probabilities respec- 
tives de ces realisations. 

Les proprieties de l’operateur esperance sont les suivantes : 
i) Pour n variables aleatoires Xi, X 2 , X n , 

E^^OiX; j = ^c i E(X i ) ou Cj est une constante. 

Par exemple, E^Xj + c 2 X 2 ) = c 1 E(X 1 ) + c 2 E(X 2 ). 

Par ailleurs, la moyenne d’une suite de variables aleatoires Xi, 

_ Lx, 

X 2 , .... X„ oil X, - NID i0 (h,<j 2 ), est de, X = -t-, 


Etix,) 

e(x)——- 


np 


= p- 


La variance 

La variance d’une variable aleatoire discrete se definit comme suit. 
V(X) = E[(X-E(X)) 2 ] = yf(x,)(xi-E(X)) ; 

= £fh) x?-[e(x)] 2 =e(x 2 )-[e(x)] ! 

Plus generalement, la variance s’ecrit: E[g(x)J = ^ g(x ; ) f (x ; ) 
on g( x i) = (x ; -E(X)) 2 . 

Les proprietes de 1’operateur variance sont les suivantes: 


10. NID : variables normales independamment distributes. 
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Pour n variables aleatoires Xi, X 2 , X n , on a: 

i) V^£c,X i j-£c?V(X 1 ) + 2££c 1 c | cov(x 1 ,X j ) Vi*j 

ou les q sont des constantes. 

ii) Si c est une constante => V(c) = 0 

iii) V(a ± cX) = c 2 V(x) ou a et c sont des constantes. 

Par exemple, supposons que X ; ~ NID (p,a 2 ). Alors, 


v(x) = V 


E*. 


£v(x,) £o 2 


- = —a - = - 


3.1.3. Distribution binomiale 

La loi binomiale se definit comme suit: 


b(i;n,p) = P(X = i) = C^p^l-p)” *, i = 0,...,n, ou 0 < p < 1 



. Cette fonction permet de calculer la 


probability associee a i succes parmi n experiences. La distribution 
binomiale sert entre autres a modeliser des experiences du type succes- 
echec, chaque experience etant independante l’une de l’autre. L’exem- 
ple classique de ce type d’experience est le lancer repete d’une piece 
de monnaie. C’est le jeu communement appele pile ou face. Si on la 
lance 3 fois, alors la probability d’avoir pile deux fois est de: 


P(X = 2) = 


2 ( 3 - 2 )! 


f 111 

r if 

3 

■ - 

i— 

= — ou p, soit la 

iUJ 1 

l 2) 

8 
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d’avoir pile, est egale a Vi II est a noter que l’on pourrait egalement 
utiliser cette formule pour calculer la probability d’avoir au moins i 
succes parmi n experiences. 

La distribution binomiale presente les proprietes suivantes. Son 
esperance E(X) = np. Sa variance est de: V(x) = np(l - p). 

Voici maintenant un exemple d’utilisation de la loi binomiale en 
finance, soit celui de revaluation d’une option europeenne 11 . Cet 
exemple est celui du modele binomial de Cox, Ross et Rubinstein 
(1979). Considerons d’abord revaluation d’une option d’achat. En 
vertu de la loi binomiale, la prime de cette option s’evalue par la 
formule suivante: 

c = e~ rt E*[Max(S t - X,0)] = j p ; (l-p) n_i Max[s o u i d n “ i -X,o] 

ou r est le taux sans risque; t, la duree en annees de l’option; n, le 
nombre de periodes; So, la valeur du prix de l’action au temps 0; u, le 
multiple de hausse du prix de l’action; d, le multiple de baisse; et X, 

le prix d’exercice. Les u et d se calculent comme suit: u = e° vt/n ; 

d = e~ aVt/n . Dans ces relatipns, s represente la volatility annuelle du 
rendement de l’action sous-jacente a l’option. Les p sont ici calcules 
dans un univers neutre au risque et s’obtiennent comme suit: 

e r ” -d 


Expliquons plus precisement la formule du prix de l’option 
d’achat. Selon celle-ci, le prix de cette option est la valeur actualisee 
de l’esperance des cash-flows a l’echeance de cette option. Cette 
esperance, notee E* pour la distinguer de l’esperance classique, est 
derivee dans un univers sans risque. Cette formule montre encore une 
fois que le prix de tout litre est la valeur actualisee de ses cash-flows. 


11. L’option europeenne, par opposition a l’option americaine, ne peut etre exercee 
avant son echeance. 
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La version binomiale du prix de l’option precise le calcul de Pespe- 
rance. On note que les facteurs de ponderation des cash-flows sont 

ceux de la binomiale, soit: 

Illustrons la procedure numerique du calcul du prix de l’option 
lorsque l’on recourt a la loi binomiale. II faut alors construire un arbre 
binomial de Involution du prix de Paction puis du prix de Poption. 
Nous nous en tenons ici a l’arbre des prix de Paction puisque celui des 
prix de Poption obeit au meme principe. Voici comment se presente 
l’arbre binomial du prix de Paction si l’on suppose trois periodes d’un 
mois. 




On laisse au lecteur le soin de remplir les cases manquantes. 
Pour plus de details, on consultera: Racicot, F.-E. et R. Theoret 
( 2000 ) 12 . 


12. Racicot, F.E. et R. Theoret (2000), op. cit. 
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3.1.4. La distribution de Poisson 

La distribution de Poisson n’est rien d’autre que la limite de la distribu¬ 
tion binomiale sous certaines conditions. Elle se formule comme suit: 

limb(i;n,p) = ^ XP ^ £ -= P * (i;n X p) = P(X = i) 

Si on pose X = n X p, on a: 

p(x=i)=p*(i ; q=^L 

L’esperance de cette distribution est de: E(X) = X. et sa variance 
est de: V(X) = X. L’esperance de la distribution de Poisson est done 
egale a la variance. 

II est a noter que la loi de Poisson peut servir d’approximation a 
la loi binomiale. La loi de Poisson peut done servir a modeliser des 
experiences du type succes-echec si les conditions suivantes sont rea- 
lisees :p<10%etnp<5. Par exemple, on veut calculer la probabilite 
(p) d’obtenir exactement deux pieces defectueuses dans un precede de 
production qui maintient en moyenne 4% de pieces defectueuses 
lorsque la taille de l’echantillon est n=100. Notons que les conditions 
d’approximation sont ici respectees: X = 4, done plus petit que la borne 
superieure de 5, et p est egal a 4%, done plus petit que la borne 
superieure de 10 %. On obtient le resultat suivant a l’aide de la bino¬ 
miale : 


P(X = 2) = b(2; 100, 0,04) = Q 00 ^ 0 , 04 ) 2 t 1 - °, 04 ) 10 ° 2 = 0,1449 
L’approximation de cette probabilite par la loi de Poisson est de: 
4 2 e^ 

P(X = 2) = P * (2;4) = —— = 0,1465 

On voit que la loi de Poisson se rapproche beaucoup de la loi 
binomiale. 
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La distribution de Poisson a donne lieu a de multiples applica¬ 
tions. Donnons quelques exemples. Hausman et al. (1984) 13 utilisent 
la loi de Poisson pour modeliser la distribution des brevets accordes 
aux entreprises pour une annee. Leur distribution de Poisson pour la 
variable y s’ecrit comme suit: 


p(yi = ))=f(i |R 0- 


(cx+pRi) 


-(a+pR;) 


ou =a + (3R i = E(y ; IR ; ). Dans cette equation, R; represente les 
depenses en recherche et developpement d’une entreprise representa¬ 
tive et j, le nombre de brevets accordes a cette entreprise dans une 
annee. Selon cette equation, plus une entreprise investit en recherche, 
c’est-a-dire plus R est important, plus l’esperance des brevets qui lui 
sont accordes est elevee. Une autre application, cette fois-ci finan¬ 
ciere, a ete formulee par Greene (1995) 14 et a trait aux cartes de credit. 
La variable qui dans son modele obeit a une loi de Poisson est le 
nombre de defauts enregistres dans l’histoire du credit d’un echan- 
tillon de clients pour une categorie de cartes de credit. Cette variable 
est en fait la plus importante pour determiner si une demande d’em- 
prunt ou de carte de credit sera acceptee. La variable dependante est 
une variable discrete de score qui mesure le nombre de defauts obser¬ 
ves durant 1’histoire du credit d’un client. Par exemple, si un client n’a 
jamais fait defaut, son score est nul. S’il a enregistre deux defauts de 
paiement, son score est de 2. Et ainsi de suite. La probabilite que y 
prenne la valeur j est la suivante: 




Encore une fois, 1’esperance de y est qui peut etre representee 
par une forme fonctionnelle lineaire, non lineaire ou tout autre forme 
pertinente. 


13. Hausman, J., B. Hall etZ. Griliches (1984), « Economic Models for Count Data 
with an Application to the Patents R&D Relationship », Econometrica, 52, p. 909- 
938. 

14. Greene, W.A. (1995), Sample Selection in the Poisson Regression Model, docu¬ 
ment de travail , #EC-95-6, Stern School of Business. 
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3.2. Lois de probability continues univariees 
et concepts bivaries 

La loi normale ou gaussienne est traditionnellement la plus utilisee en 
econometrie. Sa fonction de densite (pdf) 15 s’ecrit comme suit: 



La variable X suit une loi normale centree reduite designee par: 
X ~ N((jl, a 2 ). Les proprietes de la pdf normale sont les suivantes: 

i) La fonction f(x) >0, Vx £ (- 00 , 00 ). 16 


ii) J" f(x)dx = F(°°) = 1. F represente ici la cdf 17 d’une variable 
X quelconque. 

iii) F(-°o) = 0 


iv) 


f(x) = 


dF(x) 

dx 


v) P(x < X < x + dx) = f(x)dx 


vi) P(X = x) = J' X f(x)dx = F(x)-F(x) = 0. 

vii) P(xi <X<x j ) = £ , f(x)dx = F(x j )-F(x i ). 

Cette relation est aussi egale a: 

P( x i < X < Xj ) = P(x ; < X < Xj ) 

= P(x i <X<x j ) = P(x i <X<x j ). 

15. pdf est Pabreviation Ae. probability density function. 

16. Pour simplifier la notation, nous omettons 1’indice i a la variable x. 

17. cdf est Pabreviation de cumulative density function et represente la probabilite 
suivante: P(X < x). 
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A la suite de ces relations, plusieurs remarques s’imposent. 

a) Lorsqu’une variable est continue, les probability ne se cal- 
culent pas par reference a un point mais bien par rapport a 
une densite. Ainsi, la probability que la variable aleatoire X 
prenne une valeur ponctuelle est egale a 0 alors que ce n’etait 
pas le cas pour les variables discretes. 

b) Si la variable X est definie par: X ~ N(p,, ct 2 ), alors, E(X) = p. 

et V(X) = ct 2 . La statistique, definie comme: Z =-—, suit 

a 

une loi normale centree reduite notee N(0,1). L’esperance 
de Z, notee E(Z), est de: 

E(Z) = E fA^l = gWlj‘ = EZi‘ = o, 

V. a ) a a 

Par ailleurs, la variance de Z, notee V(Z), est de: 

v(z)-vg) + vg)=A V (x) + o = i. 

c) Le kernel 18 gaussien, qui s’ecrit: K.(z) = ——e 2 , est une 

V2ji 

fonction telle que J K(x)dx = l. Notons qu’il existe 

d’autres kernels statistiques importants: le bipondere, l’epa- 
nechnikov, le rectangulaire et le triangulaire. Ces kernels 
sont utilises pour estimer des distributions empiriques a l’inte- 
rieur d’une classe tres generale d’estimateurs non parame- 
triques du type Rosenblatt-Parzen. 

Nous abordons maintenant les definitions de l’esperance et de la 
variance en temps continu. 


18. La definition du kernel est la suivante. Soit une fonction composee f(g(x)). La 
fonction g(x) est le kernel et f, la fonction exterieure. 
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L'espe ranee 

Soit une variable aleatoire X continue. L’esperance de X se definit 
comme suit: 


E(X) = jxf(x)dx 

Cette integrale est une integrale de Riemann habituelle. Par 
ailleurs, si l’on formulait 1’integrale de la fagon suivante: J xdF, ce 
serait alors une integrale Lebesgue-Stieljes. 

La variance 

La variance de X se definit comme suit: 

V(x) = £(x-E(X)) 2 f(x)dx 
Plus generalement: 

E [^( x )] = L g W f W dx 

Dans le cas de l’esperance simple, g(x) = x; dans le cas de la 
variance: g(x) = (x-E(X)j . 

A noter qu’en temps continu, les proprietes des operateurs de 
l’esperance et de la variance sont les memes qu’en temps discret. 

Supposons maintenant deux variables aleatoires X et Y. Calcu- 
lons la covariance et la correlation de ces deux variables en temps 
discret et continu, ce qui nous introduit dans le domaine des concepts 
bivaries. 

La covariance 

La covariance entre X et Y se definit comme suit: 

Cov(x,y) = e[(x-e(x))(y-e(y))] 
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En temps discret, cette expression est egale a: 

Cov(X,Y) = ££(x-E(X))(y-E(Y))f(x,y) 

x y 

Comme dans le cas de l’esperance, il existe une formulation plus gene- 
rale pour la covariance qui la ramene dans le domaine de l’esperance: 

Cov(X,Y) = L£g( x >y) f ( x >y) 

x y 

on g(x,y) = (x — E(X))(y — E(Y)). 

Par ailleurs, en temps continu, la covariance entre X et Y est 
donnee par: 


Cov(X,Y) = ££g(x,y)f(x,y) 

Au plan echantillonnal, la covariance sxyse calcule comme suit: 

£(xi-x)(y,-y) 


La figure 1.13 est une representation graphique de la cova¬ 
riance : 

Si les realisations de X et de Y se distribuent majoritairement 
dans les quadrants I et III, alors la covariance entre ces deux variables 
est positive. Si par contre les realisations de X et de Y se distribuent 
majoritairement dans les quadrants II et IV, la covariance entre ces 
deux variables est negative. Finalement, si les realisations de ces deux 
variables sont distributes egalement entre ces quadrants, la covariance 
est nulle. 
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Figure 1.13 


n (-) 

i(+) 

hi (+) 

IV(-) 


Correlation de Pearson 

La notion de covariance donne lieu a celle de la correlation de Pearson 
p, soit: 


P 


S XY 

S X S Y 


E(x,-f)(y,-y) 


La correlation nous indique s’il existe un lien lineaire entre deux 
variables. Elle corrige la covariance de l’influence des unites de mesure 
des variables X et Y. Plus la valeur absolue de rho, soit I p I, se 
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rapproche de 1, plus le lien lineaire entre les deux variables est impor¬ 
tant. Certes, si p est egal a 0, il n’y a pas de lien lineaire. Un exemple 
theorique montre que si le lien lineaire est parfait, le coefficient de 
correlation est egal a 1. Soit Y = a + bX. On peut alors ecrire: 

Cov(X,Y) = e[(X - E(X))( Y - E(Y))] 

= E[(X - E(x))(a + bX - E(a + bX))] 

= bE[X-E(X )] 2 =bV(X) 


Par ailleurs on a: 


V(Y) = b 2 V(x) 

Cela implique que: 

bV(x) bV(x) 

P= ^),Y(Y = b ,/v(x)Jv(x ) =1 

Le meme exercice peut etre refait pour obtenir p = -1 en suppo- 
sant que Y = a - bX. II est important de souligner que la correlation ne 
mesure que le lien lineaire entre deux variables et que si la correlation 
se rapproche de 0, cela n’implique pas qu’il n’existe pas d’autres 
formes de liens entre ces deux variables. A cet effet, il existe un 
coefficient de correlation non lineaire pour capter le lien non lineaire 
entre deux variables. Ce coefficient sera discute plus en profondeur a 
l’interieur du chapitre ayant trait aux methodes de regression non 
lineaires. 

Precisons une regie de calcul de la covariance pour les cas con- 
tinu et discret. Supposons des constantes a, b, c et d, et deux variables 
aleatoires X et Y, alors on peut ecrire: 

Cov(aX + bY, cX + dY) = acV(X) + bdV(Y) + (ad + bc)Cov(X, Y) 
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La distribution uniforme (continue) 

La variable aleatoire U est uniformement distribute dans 1’intervalle 
[a,b] designe par U ~ U (a,b) si elle obeit a la pdf suivante: 


f(u) 


1 

b-a 

0 


si a < u < b 
autrement 


ou u est une realisation de U. 

Les proprietes de cette distribution sont les suivantes: 
i) L’esperance de U, soit E(U), est egale a: 


E(U) = - 


2 

La demonstration est la suivante. 


f fb 1 u 2 1 

E(U) = fuf(u)du = f u-du — x-+ c 

; Ja b-a 2 b-a | a 

b 2 -a 2 1 (a + b)(b-a) 1 a + b 
b-a 2 b-a 2 2 

ii) La variance de U, soit V(U), est egale a: 

V(U) = e[(U-E(U)) 2 ] = 1L^- 


ou E(U 2 )= [u 2 f(u)du = f-du. 

a a b - a 

Illustrons la distribution uniforme a partir de l’exemple suivant. 
On suppose que a = 0 et b = 1. On obtient alors la distribution uniforme 
tres connue U(0,1). Cette distribution est representee a la figure 1.14. 
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Figure 1.14 



a = 0 0,1 0,3 b=l 


Sur la figure 1.14, la region hachuree nous indique la probability 
que la variable aleatoire U soit inferieure ou egale a 0,3 ou superieure 
ou egale a 0,1. 

La cdf de la distribution uniforme se calcule comme suit: 

F(u) = P(U < u) = }f(t)dt 


0 si u < 



1 


si a < u < b 
si u > b 


La fonction F(u) apparait a la figure 1.15. 

II importe de fournir quelques exemples d’utilisation de la distri¬ 
bution uniforme: 


a) Generation de nombres aleatoires 

Les programmes informatiques qui servent a calculer des variables qui 
obeissent a la loi normale et a ses derivees sont bases sur un genera- 
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teur de variables pseudo-aleatoires de loi uniforme. On applique alors 
une transformation Box-Miiller pour passer de la loi uniforme a la loi 
normale. 


Figure 1.15 


F(u) 



b) Calcul du coefficient de correlation de Spearman 

Le coefficient de correlation de Pearson n’est pas robuste, en ce sens 
que lorsque les donnees devient de la loi normale, ce coefficient doit 
etre utilise avec circonspection. Un coefficient de correlation (non 
parametrique) robuste aux deviations de la normalite est celui de 
Spearman. II est souhaitable de toujours comparer le coefficient de 
Pearson a celui de Spearman; si le premier devie significativement 
du second, il serait preferable d’etablir des conclusions a partir du 
coefficient de Spearman. 

Pour calculer le coefficient de correlation non parametrique de 
Spearman, on doit dans un premier temps transformer les donnees en 
rang; pour ce faire, on utilise la distribution uniforme U(a,b). Plus 
precisement, le calcul du coefficient de Spearman s’etablit comme suit 
pour deux variables X et Y: 


Cov(R,S) 

ip “' = Vv(R)V(S) 
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L’estimateur de ce coefficient, soit p Spear , est de: 

E((R,-R)(s,-s)) 

PSpear — j j 

ou R est le rang de X et S, le rang de Y. 

On peut illustrer cette formule par un exemple. Les realisations 
de X sont les suivantes : 


f 33 
44 

x — 32,3 
24 

v 55 , 

A partir de ce vecteur, illustrons la transformation de X en rang 
R. Pour obtenir R, on transforme X comme suit et on numerate les 
realisations. On obtient alors R* : 


f 24 > 


< r 

32,3 


2 

33 

-> r* = 

3 

44 


4 

. 55 , 


J, 


© 2001 - Presses de l’Universite du Quebec 

Edifice Le Delta I, 2875, boul. Laurier, bureau 450, Quebec, Quebec G1V 2M2 «Tel.; (418) 657-4399 - www.puq.ca 












Rappels statistiques 37 


Par consequent, x implique le vecteur r suivant: 


^ 33 ^ 


f 3" 

44 


4 

32,3 

-> r = 

2 

24 


1 

, 55 V 


,5, 


ou r = 3 =-= ^ 1 ou n = 5. De fagon analogue, le vecteur 

2 n 

s est egal a: 

1 

s = 4 

2 

^ 5 , 

Done, par cette transformation des donnees, on obtient une 
distribution uniforme. 

Comme le coefficient de Spearman, le coefficient de Kendall t 
est egalement utilise dans la pratique comme alternative au coefficient 
de Pearson et se definit comme suit: 

_ S _ # de paires concordantes - # de paires discordantes 

' =i: l 
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L’avantage de t sur le coefficient de Spearman est qu’il n’est 
point besoin d’utiliser le rang pour calculer cette statistique. On com¬ 
pare simplement les grandeurs relatives des combinaisons possibles: 


C? 


n! 


2!(n-2)! 


1 

2 


L(n -1) de paires: (x;, yj). 


II faut noter que l’on n’utilise ici aucune distribution pour effec- 
tuer les comparaisons. En ce sens, le coefficient de Kendall est encore 
moins restrictif que celui de Spearman. 


4. Notions d'independance, de densite jointe 

ET DE DENSITE MARGINALE 

Pour n variables aleatoires Xi, X 2 , X n , discretes ou continues, on 
dit que 1’on a independance entre ces variables si l’on peut ecrire la 
densite jointe (continue) des realisations de ces variables aleatoires 
comme le produit des distributions marginales de ses realisations. La 
densite jointe de Xi, X 2 ..., X n s’ecrit done: 

f(x 1 ,x 2 ,...,x n ) = f 1 (x 1 )f 2 (x 2 )...f n (x n ) 
ou, par exemple, 

f i ( x i)= J J J- Jf(xi,x 2 ,x 3 ,x 4 ,...,x n )dx 2 dx 3 dx 4 ...dx n estladensite 

marginale de la variable aleatoire continue Xi. Dans le cas discret, la 
fonction de distribution marginale s’ecrit 

fl( x l) = l^LE-L f ( X l’ X 2’ X 3’ X 4>-> x n)- 


Pour deux variables aleatoires Xi etX 2 , on a comme fonctions de 
distribution marginales: 


f(xi,x 2 ) = fi(xi)f 2 (x 2 ) 
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OU f 2 ( x 2 ) = Jf(xi,x 2 )dx 1 si Xi et X2 sont continues et 
^2 ( x 2) = ^( x i ’ x 2) si Xi etX 2 sont discretes. 


La consequence de l’independance au chapitre de la covariance 
est la suivante. Dans le cas de deux variables aleatoires Xi et X 2 , 
1’independance implique une covariance nulle: 

Cov(Xj,X 2 ) = e[(Xj -E(X 1 ))(X 2 -E(X 2 ))] 

= e(x 1 x 2 )-e(x 1 )e(x 2 ) = o 


Ceci implique: 


e(x,x 2 ) = e(x,)e(x 2 ) 

Prouvons maintenant ce resultat, a savoir que la covariance est 
nulle si les deux variables aleatoires sont independantes, en utilisant 
les resultats precedents ayant trait a la forme des distributions jointes 
et marginales dans le cas ou il y a independance entre deux variables 
aleatoires. La preuve est la suivante: 

E [g( x n x 2 )] = LE f ( x i> x 2) g( x i, x 2 ) 

*1 *2 

ou g(X 1 ,X 2 ) = (X t — E(X x ))(X 2 — E(X 2 )) pour la covariance. Dans 
ce cas, 

E[g(X„X 2 )] - Cov(X,,X 2 ) = E[(X, -E(X,))(X 2 -E(X 2 ))] 

= EEb,-E(Xi))(x 2 -E(X 2 ))f(x 1 .x 2 ) 


En vertu de l’independance, on a: f(x 1 ,x 2 ) = f 1 (x 1 )f 2 (x 2 ). 
Alors, 
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Cov(X 1J X 2 ) = ££(x 1 -E(X 1 ))(x 2 -E(X 2 ))f 1 (x,)f 2 (x 2 ) 


= E(*i-E( x i)) f .(*.)E(*2-E(X 2 ))f 2 (x 2 ) 


=^L f i( x i) x i-E E ( x i) f i( x i)j 

[l f 2( X 2) X 2-EE(X 2 )f 2 (x 2 )j 

= (e(x,)-e(x,))(e(x 2 )-e(x 2 )) = o 


Expliquons ces dernieres equations. Par definition, 

Ef^xJxj = E(Xj). Par ailleurs, 

£E(X 1 ) f,(xj) = E(Xj)E f 1 (x 1 ) = E(X 1 )xl = E(Xj), 

ce qui demontre la formule. On se rend done compte que 1’indepen- 
dance implique une covariance nulle. Mais l’inverse n’est genera- 
lement pas vrai sauf pour des variables aleatoires normalement 
distributes. Par exemple, supposons une combinaison non lineaire des 
variables aleatoires X et Y, soit X 2 + Y 2 = 1. Leur covariance peut etre 
tres rapprochee de 0, mais il existe pourtant un lien evident entre ces 
deux variables. 


5. Probability conditionnelles 

ET DENSITES CONDITIONNELLES 

Soit deux variables aleatoires X et Y. La probability de X condition- 

neUe a Y s'ecrit : f (xly) = ^ = P(xly) = 

1 V) f y (y) 1 W P(Y = 

ou f y (y) est la distribution marginale de y. Ces egalites sont valables en 
totalite dans le cas discret mais seules les deux premieres le sont dans 
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le continu. Pour n variables aleatoires, le principe est le meme. Con- 
siderons par exemple trois variables aleatoires X, Y et Z. La densite 
conditionnelle de Z s’ecrit comme suit: 


f(z| X ,y) = 


f ( x >y> z ) 

f( x >y) 


De cette equation, il decoule que la densite jointe peut s’ecrire comme 
le produit de densites conditionnelles: 


f( X ,y,z) = f(z|x,y)f(x,y) = f(z|x,y)f (y|x)f(x) 

Si 1’on suppose que les variables X, Y et Z sont independantes, cette 
derniere equation s’ecrit alors comme suit: 

f( W ) = f(x)f(y)f(z) 

ce qui represente le produit des densites marginales. 


6. Theoreme central limite (cas univarie) 


Nous allons maintenant introduire un theoreme tres important en 
theorie statistique, soit le theoreme central limite. Ce theoreme justi- 
fie 1’utilisation de la loi normale en econometrie. Ce theoreme est tres 
important parce que beaucoup de concepts econometriques sont bases 
sur lui. Par exemple, en theorie asymptotique, on se sert de ce theo¬ 
reme pour formuler certains tests statistiques comme le test de Jarque 
et Bera qui, a la limite, suit une distribution y 2 qui, elle, est une 
normale au carre. Le theoreme central limite s’enonce comme suit. 


Si Xi, X 2 , ..., X n sont des variables aleatoires IID (p, cr 2 ) et que 

„ ^ Xl X-E(x) x-p r x-u 

X = — -, alors la statistique Z = - - 




7? 


dispose d’une pdf qui s’approche de la loi normale centree et reduite 
N(0,1) a mesure que n tend vers l’infini. 
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Selon ce theoreme, la moyenne de n variables independantes qui 
obeissent a une distribution quelconque (en autant que la distribution 
ait une moyenne et une variance) s’approche done d’une N(0,1) apres 
l’avoir centree et reduite sur un echantillon suffisamment grand. Plus 
formellement, ces resultats se formulent comme suit. 

X-Lfe'^dZ 

n ^“ L O J V27c_i 


Ceci implique que: 


ou, en termes equivalents, 



II est a souligner qu’il s’agit ici de la convergence en distribution. II 
existe en effet d’autres modes de convergence, soit la convergence en 
probability, en moyenne quadratique et la convergence presque sure. 
Ces differents types de convergence seront discutes ulterieurement. 


7. La loi normale multivariee 

Nous avons presente precedemment la loi normale univariee qui 
s’applique a une serie d’observations sur une seule variable aleatoire. 
Mais il convient de generaliser cette distribution a plusieurs variables 
aleatoires. On parle alors de distribution normale multivariee. La pdf 
multivariee s’ecrit comme suit: 

f <*)= —i— r e xpf-2(x-n-) T i;- 1 (x-ix)) 

(2»)I|E|3 V 2 1 

ou x est un vecteur de k variables aleatoires supposees dependantes, p. 
est le vecteur de leurs moyennes et X, la matrice variance-covariance. 
La distribution de x s’etablit comme suit: x ~ N((jl, X). Si les variables 
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aleatoires sont independantes, alors % = cr 2 I, I etant la matrice identite. 
Sachant que dans ce cas particulier |£| = a 2k , la pdf multivariee s’ecrit: 

——r ex pf--(*-M’) T "H* - ! 1 ) 

( 2 ™ 2 Y 2 ^ 2 

= n =f(x ' ,f(X!M(xi > 

Par consequent, la densite jointe est le produit des densites marginales 
dans le cas de variables independantes. On retrouve le resultat prece¬ 
dent, a l’effet qu’une covariance (correlation) nulle entre des variables 
normalement distributes donne lieu a Pindependance statistique. 

Dans le cas bivarie, c’est-a-dire que lorsqu’il n’y a que deux 
variables aleatoires, la pdf s’ecrit: 


f(*,y) = 



exp 


1 

2(l-p 2 ) { 





La distribution bivariee est utilisee en finance pour calculer par 
exemple le prix d’options ecrites sur deux actifs ou encore dans le 
modele de Whaley 19 , qui consiste a calculer de fagon analytique le 
prix d’une option d’achat americaine ecrite sur une action versant un 
dividende. 


19. Pour plus de details, voir: Racicot, F.-E. et R. Theoret (2000) , Traite de gestion 
de portefeuilie: titres a revenus fixes et produits derives, Presses de l’Universite du 
Quebec, chapitre 6. 
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8. Estimation de la moyenne et de la variance 

DANS UN MODELE SIMPLE 


Supposons que la variable aleatoire Y se formule comme suit: 


Yj = P + ej, i = l,...,n 

ou ei ~ IID (0, ct 2 ). P est une constante et Y est alors une variable 
aleatoire. ej est une variable aleatoire appelee terme d’erreur et suppo- 
see provenir d’une population de moyenne 0 et de variance a 2 . Par 
hypothese, les ei sont supposes independants, c’est-a-dire Cov(ej, ej) = 0 
Vi ^ j. En termes matriciels, on peut reecrire ce modele comme suit: 


Y = pi + e 




T 


e i 

y 2 


l 


e 2 


5 1 ~ 


et e = 


_Y n _ 

nxl 

l 

nxl 

e n 


Notre objectif est d’estimer la moyenne de Y a partir de ce 
modele. Comme E(Yj) = E(p + e;) = P, il suffit de trouver un 
estimateur de p pour obtenir un estimateur de la moyenne de Y. Pour 
ce faire, nous recourons a la methode des moindres carres ordinaires 
(MCO). Selon cette methode, il faut minimiser la somme des e, au 
carre pour trouver l’estimateur recherche. 

Nous disposons de n realisations de Y, notees par yi, i = 1, ..., n. 
Le principe des MCO consiste a minimiser la somme suivante: 
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S = £df 

oud i = 1 /(y 1 -p) 2 est une distance euclidienne. Plus precisement, le 
probleme de minimisation est le suivant: 

MinS = Min^dj 2 = Min^(y; -(3) 

P P i=i P i=i 

On peut developper la sommation comme suit: 

X2(yi-P) 2 = £(y- — 2(3yi +(3 2 ) = £y 2 -2p£ yi +n(3 2 

ou la somme des p 2 est egale a n|3 2 . Pour obtenir le minimum de S, il 
suffit d’egaliser sa derivee premiere par rapport a p a 0: 

“ = 0 _2 ^yi +2nP = 0 
dP i= i 

II resulte que: 



Done, par ce probleme de minimisation, on a trouve que 1’estimateur 
de p, soit P, est la moyenne arithmetique de l’echantillon. Cet esti- 

. i Y - 

mateur est valable pour tout echantillon, c’est-a-dire que: p = —-. 

n 

L’esperance de P est de: 



I E [ y )= E ( Y i)=p 


© 2001 - Presses de l’Universite du Quebec 

Mituntxlul boul Lauriet hnn.au +5(1 Quebec QmSbecGlV ’MI* ICI MIS)<S'M WJ 

Tir6: Traitf d'icammetriefinmciire, Fran^>is-Eric Raoioot et Raymond TMoret, ISBN 2-7605-1123-5 







46 Traite d’econometrie financiere 


Le biais d’un estimateur est egal a: biais(P) = E(p) - (3. Dans le 
cas qui nous interesse, le biais est nul. Par consequent, si on simule des 
echantillons en recourant a la methode de Monte Carlo et que Ton 
calcule P pour chaque echantillon, alors en moyenne on trouve que P 
est egal a la moyenne de la population, c’est-a-dire p. 


La variance de P, ici egal a la moyenne, se calcule comme suit: 




£v(Y ; ) £v(P + ei ) 


Pour estimer a 2 , on utilise a 2 qui est egal a: 



n -1 


ou e^Yj-p. L’estimateur a 2 de o 2 est sans biais parce que 
E^d 2 j = a 2 . La demonstration de ce resultat est presentee a l’appen- 
dice de ce chapitre. 


9. Theoreme de Gauss-Markov 

L’estimateur des MCO de p est l’estimateur BLUE 20 de ce parametre. 
Un estimateur est dit BLUE si, parmi tous les estimateurs lineaires 
non biaises, il est le plus efficace. Cette proposition repose sous l’hypo- 
these peu restrictive que les ej ~ IID(0, a 2 ). Un estimateur BLUE est 
par definition: i) sans biais; ii) efficace, c’est-a-dire a variance mini¬ 
male dans sa classe. Incidemment, on peut trouver des estimateurs 
non lineaires biaises mais a variance inferieure a celle des MCO. 
L’ecart quadratique de tels estimateurs peut meme etre plus faible que 
celui des MCO. Notons que l’ecart quadratique moyen (EQM) de P 
se definit comme suit: EQM(P) = Biais 2 |pj + v|pj. 


20. BLUE est 1’acronyme anglais de l’expression: Best Linear Unbiaised Estimator. 
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10. La methode d'estimation du maximum 

DE VRAISEMBLANCE 

On veut estimer le parametre p de l’equation de y presentee a la 
section precedente par la methode du maximum de vraisemblance. 
On rappelle que y 21 est egal a: 

Ji = P + ei 

ej suit une NID(0, a 2 ). La methode du maximum de vraisemblance 
requiert que la distribution des residus soit specifiee, ce qui n’est pas 
le cas des MCO comme nous l’indique le theoreme de Gauss-Markov. 
La densite jointe des residus s’exprime done comme suit: 

f(e 1 ,e 2 ,...,e n ) = f(e 1 )f(e 2 )...f(e n ) 

en vertu de l’independance des residus. La methode du maximum de 
vraisemblance exige que l’on passe des residus a y. Pour ce faire, on 
recourt a la transformation jacobienne. Pour circonscrire ce concept, 
supposons une fonction monotone reliant y a e, representee a la 
figure 1.16. 

Demontrons informellement la provenance de la transformee 
jacobienne. A partir de la figure 1.15, on observe que la probability de 
se situer dans Pintervalle Ay est egale a la probability de se situer dans 
l’intervalle Ae, ceci etant du au fait que y est lie a e par une fonction 
monotone. Mathematiquement, on peut representer cette relation 
comme suit: 

Ay xf(y) = Aexf(e) 

A partir de cette expression, on obtient la transformation jacobienne 
en recourant aux transformations suivantes : 

f(y) = f( e )A 

Ay 


21. Par la suite, dans le but d’alleger 1’expose, on ne fait plus de distinction entre 
variable aleatoire et realisation. 
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Figure 1.16 



Si on prend la limite quand Ae —> 0, on obtient le resultat suivant: 

f (y) = f ( e )|^| 

l d y| 


de 

ou I. I designe ici valeur absolue. Si l’on prend la valeur absolue de —, 

dy 

c’est pour s’assurer de la positivite de f(y) puisque l’on a suppose une 
fonction monotone croissante. Generalisons ce resultat au cas de 
plusieurs variables aleatoires ei, ei, e 3 , ...e n . On a alors, en termes 
vectoriels: 


f(y) = f(e) FH 

\M 

ou — represente la valeur absolue du determinant de la matrice de 
derivees partielles suivante: 
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■0^ 

3^ 

3^' 

3yi 

3y 2 

3y„ 

3e 2 

3e 2 

3e 2 

3yi 

3y 2 

dy„ 

3e n 

3e n 

3e n 

_3yi 

3y 2 

a y n . 


La valeur absolue du determinant de cette matrice est connue sous le 
nom de jacobien de transformation de e a y. On recourt a ce jacobien 
pour passer de la fonction de densite de e a la fonction de densite de 
y. Pour simplifier, considerons le cas univarie. On a: 

e i -Fi “P 


Alors, —- = 1. Ce qui implique la transformation jacobienne sui- 
dy ; 

vante: f(y,) = lxf(e ; ). Dans le cas multivarie, la matrice des deri- 
vees partielles est egale a la matrice identite. 

Les developpements qui precedent servent a ecrire la fonction de 
densite jointe du vecteur y a partir de celle du vecteur e. La densite 
jointe de y est de: 

f (yi>y2>-yn) = f(yi) f (y2)- f (y n ) 
ou f(y ; ) = * exp — — x I ——-1 . On a ici utilise la regie de 

A/27ta 2 ( M o J j 

transformation de la fonction de densite des y; a celle des e, qui vient 
d’etre etablie. Puisque la densite jointe est ici le produit des densites 
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marginales, les ej etant independants par hypothese, et par consequent 
les yi, on peut ecrire: 



Notons que f(.) est determine en fonction de valeurs donnees pour p 
et a 2 , d’ou le caractere conditionnel de la densite jointe. La fonction 
de vraisemblance est pour sa part une fonction des parametres, condi- 
tionnelle aux valeurs observees de y, c’est-a-dire: 

L (p.° 2 |yi>y2 5 ->yn) = (27t) 2(a 2 ) 2 exp|--^J^^-^j j 

La methode du maximum de vraisemblance consiste a trouver les 
parametres p et a 2 qui maximisent la probability (densite de probabi¬ 
lity) de generer 1’echantillon observe. Pour alleger, exprimons cette 
fonction en termes de logarithme: 


l = Inf = ln(27t)- — lna 2 ^ 

Pour estimer p et ct 2 , il suffit de maximiser € par rapport a ces 

parametres, c’est-a-dire Max L Pour ce faire, on egalise les derivees 

P,a 2 

de € par rapport a ces parametres a 0: 


di_ 

ap 


^l(2<y,-P) 


= 0 


On obtient la valeur de p par les manipulations suivantes: 


Pour obtenir un estimateur de ct 2 , on suit la meme procedure que 
pour p. Pour simplifier le calcul, posons cr 2 = u. On derive done la 
fonction de vraisemblance par rapport a u et on l’egale a zero: 
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—=—--y"-u _2 (yi-p ) 2 = o 

du 2u 2^ 1 ' 

Si on remplace dans cette equation u par <t 2 , on a: 

d£ n 1 1 t\ —2 / >»\2 

M) 

En simplifiant, on obtient: 


n 

On constate done que l’estimateur de p donne par le maximum de 
vraisemblance est identique a celui qui resulte des MCO. Par conse¬ 
quent, nous nous sommes permis de substituer (3 a (3. Cependant, 
l’estimateur du maximum de vraisemblance de a 2 est biaise alors que 
celui associe des MCO, note a 2 , ne I’est pas. Done, en supposant la 
normalite des residus, utiliser la methode des MCO revient a utiliser 
celle du maximum de vraisemblance en ce qui concerne 1’estimateur 
de P, e’est-a-dire: P = P. Mais par contre, 1’estimateur du maximum 
de vraisemblance de la variance est biaise dans les petits echantillons 
mais convergent, e’est-a-dire que le biais disparait dans les grands 
echantillons. 


11. Tests d'hypotheses 

ET INTERVALLES DE CONFIANCE 

Supposons le modele suivant: 

y, = P + e i; i = l,...,n 

et e, ~ NID(0, a 2 ), ou a 2 est connu. Si on applique les MCO a ce 
modele, on obtient alors p. Selon les hypotheses qui concernent les 
residus, on peut ecrire: 
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P-j =>(p-p)~ n(o,^J => 2 = - N(0,1). 

Les tests d’hypothese sont bases sur cette statistique z. Pour tester si 
p est significativement different d’une valeur donnee (test bilateral), 
c’est-a-dire tester les hypotheses suivantes: 


HO: P = Po 

HI: P ^ Po> 

on construit z en remplagant p par Po et le test sera de rejeter HO au 
niveau de signification a si et seulement si: 


M- 



> Z c 


Le test bilateral est represente a la figure 1.17. 
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— = P(z > z c ) = P(z < —z c ) = jf( z ) dz = J* f (z) dz 

ou f(z) est le kernel de la normale. On peut aussi ecrire, en recourant 
a la cdf: 


| = F(-, C ).1-F(, C ) 

Par consequent, 

F(-z c ) + [1 -F(z c )] = l-P(-z c < z < z c ) = a 

, x a 

Notons que si F(z c ) est monotone, F(—z c J = — => -z c = F 

En vertu de cette derniere equation, 1’intervalle de confiance de 
P est: l-(l-P(-z c <z<z c ))- On a done, en substituant z par sa 
valeur: 




1-a 


En effectuant quelques manipulations, on obtient 1’intervalle de con- 
fiance pour p: 


pf P — z c —j= < P < P + z c —j= | = 1 — a 
V Vn Vn J 

Anterieurement, on a suppose que ct 2 etait connu, ce qui n’est plus le 
cas ici. 


Tests et intervalles de confiance 
lorsque a 2 n'est pas connu 

Test t 

P-P 

En substituant a a ct dans l’equation de z, soit z =-—, on obtient 

la statistique t de Student: a / V n 
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t(n-i) 



e j = y | — (3 et (n - 1) etant le nombre de degres de 


liberte. La statistique t est en fait le ratio d’une normale N(0,1) et d’une 


-. Ouvrons ici une parenthese sur la distribution \ 2 ■ Une x 2 (l) 

V n-1 


est une N(0,1) au carre. Plus generalement, la somme de n variables 
normales au carre suit une distribution x 2 (n). Plus formellement, 


y,z 2 ~ X 2 (n). L’allure de cette distribution apparait a la figure 1.18. 


Figure 1.18 
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Pour fixer les idees, supposons que: ej ~ N(0, ct 2 ). Ceci implique 
que: — ~ N(0,l). 

° n f e iV 

En vertu des explications anterieures, ^ — ~ X 2 ( n )- 

“ P gjV (n-l)cj 2 ,, . 

Dans le cas ou l’on substitue ei a e,, — =---X ( n -1), 

£iV a J o~ 

Ve, 2 

ou ct = ——. II reste (n - 1) degres de liberte en raison de Pestima- 

tion de la variance qui consomme un degre de liberte parce qu’elle 
requiert l’estimation de la moyenne. Par consequent, 

t = = CT ^j n = -tjL. CQFD. 

M 11 " 1 ) ( n - 1 )* 2 &/4n 

1 n -1 i(n -1)ct 2 

Nous voulons maintenant tester si (3 est significatif au niveau de 
confiance a. Ce test, a caractere bilateral, est le suivant: 


HO: (3 = (3 0 

HliMPo 

Nous voulons ici effectuer ce test pour le cas du modele precedent. La 
regie du test est ici de rejeter HO au niveau a, qui est egal a 5 % sauf 
indication contraire, si: 


M- 





ou tc est la valeur critique de la distribution t associee a a. La figure 1.19 
represente la distribution t. Cette distribution a grosso modo la meme 
forme que la normale a partir d’un nombre de degres de liberte egal 
a 120 et s’en rapproche de plus en plus par la suite pour devenir 
identique a la normale lorsque le nombre de degres de liberte tend 
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vers l’infini. En dega de 120 degres de liberte, la forme de cette 
distribution depend du nombre d’observations et a incidemment des 
queues plus epaisses que la normale. 


Figure 1.19 



L’intervalle de confiance de p se construit exactement comme 
dans le cas ou a est connu, sauf qu’il faut remplacer <r par a. Cet 
intervalle se construit comme suit: 


[ c 6/sfn C J 
Ce qui implique: 

p[|3-t c cj/Vn < P < P + t c a/ Vn] = 1-a 

Cette equation signifie que la probabilite que p soit contenu dans l’inter¬ 
valle aleatoire est egale a (1 - a). C’est-a-dire que dans 100 echan- 
tillons generes, l’intervalle contiendra 95 fois p si a est fixe a 5 %. On 
ecrit aussi de maniere plus succincte cet intervalle comme suit: 

P±t c a/ 
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Passons maintenant au test unilateral sur (3. Ce test est le suivant. 

HO: (3 < (3 0 

HI: P > P 0 

Ce test se formule comme suit: 


t= H. 

Z ~ a/Vn 


t c (n-!) 


La regie de decision est la suivante. On rejette HO si t > tc (n - 1). 
La figure 1.20 illustre le test unilateral sur 0. 


Figure 1.20 



Soit l’exemple suivant pour illustrer les deux tests precedents. 
Dans le cas du test bilateral, si le nombre de degres de liberte est 
superieur a 120 et que a est superieur a 5 %, t c est egal a 1,96, puisque 
la probability d’exceder ce nombre, qui est mesuree par la surface sous 
la distribution t comprise entre t c et Pinfini, est egale a 0,025. Dans le 
cas du test unilateral, tel que Pillustre la figure 1.20, le tc sera de 1,645, 
toujours pour un nombre de degres de liberte superieur a 120. On 
trouve ce nombre dans la table de la distribution t qui apparait a 
l’annexe X. 
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Erreur de type I et II et puissance d'un test 

A ce stade-ci, il convient d’introduire certains concepts utiles dans la 
theorie des tests, en 1’occurrence l’erreur de type I et la puissance d’un 
test. L’erreur de type I se definit comme la probabilite de rejeter HO 
alors que cette hypothese est vraie. Par consequent, la probabilite de 
l’erreur de type I est egale a a. Plus precisement, 

P[|t| > t c ] = P[t > t c ] + P[t < -t c ] = —+ — = a 

Pour sa part, l’erreur de type II est la probabilite de ne pas rejeter HO 
alors que HO est fausse. La probabilite de l’erreur de type I est 
inversement reliee a la probabilite de l’erreur de type II. 

La puissance est definie en termes de l’erreur de type I: 
Puissance = nombre de fois qu’un test a commis une erreur de type I 

On peut evaluer la puissance d’un test en recourant a la simulation de 
Monte Carlo. Dans ce contexte, une simulation de Monte Carlo 
consiste a generer plusieurs echantillons et a calculer le nombre total 
de fois que le test a commis une erreur de type I sur l’ensemble des 
echantillons generes. 

Un autre concept ffequemment utilise dans la pratique est la 
p-value. La p-value associee a une statistique donnee est la probabilite 
d’obtenir (par hasard), pour une experience aleatoire quelconque, une 
valeur au moins aussi grande, en valeur absolue, que la valeur obtenue 
pour ladite statistique. 

p - value(t*) = 2^1 - F(|t|, n -1)j = 2 x P(|t| > t *) 

= 2xP(l-P(t < t*)) 

ou t* est la valeur estimee de la statistique t. 

La figure 1.21 illustre le calcul de la p-value. La p-value repre¬ 
sente la probabilite que la variable aleatoire t soit dans I’une ou l’autre 
des deux zones hachurees. Au seuil de confiance de 5 %, la p-value 
doit etre inferieure a 0,05 pour que la statistique associee a la p-value 
soit significative. Par exemple, dans le cas de la statistique t, une 
p-value inferieure a 0,05 est associee a un t superieur a 1,96 pour un 
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nombre de degres de liberte superieur a 120. Incidemment, la p-value 
peut etre calculee pour toute autre statistique, telles la F et la chi-carre. 


Figure 1.21 



Test F 

A partir de la statistique t de Student, soit: t = —-- ou 

Vw/(n-l) 

w = ———— x 2 (n -1) et z ~ N(0,1), en mettant le t au carre, on 

a 2 

obtient: 

t 2 ^ X 2 (l)/1 

w/(n-l) x 2 (n-l)/(n-l) 

La distribution F est done le ratio de deux variables aleatoires de 
distributions chi-carre independantes divisees par leurs degres de 
liberte respectifs, soit 1 et (n - 1). La distribution F est representee a 
la figure 1.22. 


= F(l,n-l) 
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Figure 1.22 


m f 


0 



F c 


F 


On pourrait remettre en question l’utilite de la statistique t etant 
donne la relation directe entre t 2 et F. La reponse est simple. Alors 
que la statistique t permet d’effectuer des tests unilateraux, ce n’est pas 
le cas pour la statistique F, puisqu’elle est le carre du t. Nous expose- 
rons plus en details le test F ulterieurement. 


12. Applications numeriques 


Les donnees utilisees pour illustrer les concepts exposes anterieure- 
ment concernent les depenses mensuelles effectuees a partir de cartes 
de credit de 72 individus. Ces donnees ont ete colligees par Greene 
(1992) 22 . Au tableau 1.1, on retrouve un histogramme des observa¬ 
tions ainsi que les differents moments de la distribution et le test JB de 
normalite ainsi que sa p-value. 


22. Greene, W. (1992), A Statistical Model for Credit Scoring, document de 
recherche n° EC-92-29, Universite de New York, departement d’economie, 
Stern School of Business. 
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Tart, fait 1.1 



Series: CARTE 

Sample 1 100 

Observations 72 

Mean 

262,5321 

Median 

158,3200 

Maximum 

1898,030 

Minimum 

9,580000 

Std. Dev. 

318,0468 

Skewness 

2,958400 

Kurtosis 

14,04712 

Jarque-Bera 

471,1422 

Probability 

0,000000 


Sur ce tableau, on constate que la moyenne des depenses men- 
suelles effectuees a partir de cartes de credit est egale a 262,53 $. La 
mediane, a hauteur de 158,32 $, s’avere ici tres differente de la 
moyenne, ce qui est un signe de non-normalite. L’ecart-type de la 
variable CARTE indique par Std.Dev., est de 318,05 $. Cela repre¬ 
sente une variation importante puisque le minimum de cette variable 
est de 9,58$ et le maximum de 1898,03$. En effet, les coefficients 
d’asymetrie et d’aplatissement sont respectivement de 2,96 et de 14,05, 
ce qui differe substantiellement des valeurs correspondantes pour la 
normale, soit 0 et 3. La valeur de la statistique Jarque-Bera est de 
471,14 (p-value: 0,00), ce qui indique que la distribution empirique 
des donnees n’est pas normale. Ceci etait anticipe puisque cette statis¬ 
tique est basee sur l’asymetrie et l’aplatissement. 

Au tableau 1.2, l’estimation par les moindres carres ordinaires du 
parametre p represente par la variable C est de 262,53, ce qui corres¬ 
pond a la moyenne de la variable CARTE qui apparait au tableau 1.1. 
L’ecart-type de ce coefficient est de 37,48. Supposons que l’on veut 
tester l’hypothese HO: (3 > 158,32 (mediane) contre l’hypothese HI: 
P < 158,32. Ce test est done unilateral. La statistique t associee a la 

, 262,53-158,32 „ , , 

moyenne est de-= 2,78. Ear aiiieurs, la valeur critique 

37,48 
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de t avec (n - 1) = 71 degres de liberte est approximativement de 1,66. 
Ce test invalide done l’hypothese nulle HO: (3 = 158,32 au niveau de 
a = 5%. 

Tableau 1.2 


Dependent Variable: CARTE 

Method: Least Squares 

Date: 04/13/00 Time: 19:21 

Sample: 1 100 IF X3 > 0 

Included observations: 72 

Variable 

Coefficient 

Std. Error t-Statistic 

Prob. 

C 

262.5321 

37.48218 7.004184 

0.0000 

R-squared 

0.000000 

Mean dependent var 

262.5321 

Adjusted R-squared 

0.000000 

S.D. dependent var 

318.0468 

S.E. of regression 

318.0468 

Akaike info criterion 

14.37607 

Sum squared resid 

7181919. 

Schwarz criterion 

14.40769 

Log likelihood 

-516.5384 

Durbin-Watson stat 

1.785861 


Dependent Variable: CARTE 

Method: Least Squares 

Date: 04/13/00 Time: 18:15 

Sample: 1 100 IF X3 > 0 

Included observations: 72 

Variable 

Coefficient 

Std. Error t-Statistic 

Prob. 

C 

-304.1486 

160.7096 -1.892535 

0.0626 

REVENU 

225.6555 

74.60287 3.024757 

0.0035 

REVENUE 

-14.24923 

7.185293 -1.983111 

0.0513 

R-squared 

0.239702 

Mean dependent var 

262.5321 

Ajusted R-squared 

0.217665 

S.D. dependent var 

318.0468 

S.E. of regression 

281.3115 

Akaike info criterion 

14.15758 

Sum squared resid 

5460396. 

Schwarz criterion 

14.25244 

Log likelihood 

-506.6727 

F-statistic 

10.87696 

Durbin-Watson stat 

1.679384 

Prob(F-statistic) 

0.000078 
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Dependent Variable: CARTE 

Method: Least Squares 

Date: 04/13/00 Time: 18:14 

Sample :1 100 IF X3 > 0 

Included observations: 72 

White Heteroskedasticity-Consistent Standard Errors & Covariance 

Variable 

Coefficient 

Std. Error t-Statistic 

Prob. 

C 

-304.1486 

167.3797 -1.817118 

0.0735 

REVENU 

225.6555 

86.57141 2.606582 

0.0112 

REVENUE 

-14.24923 

7.084070 -2.011447 

0.0482 

R-squared 

0.239702 

Mean dependent var 

262.5321 

Ajusted R-squared 

0.217665 

S.D. dependent var 

318.0468 

S.E. of regression 

281.3115 

Akaike info criterion 

14.15758 

Sum squared resid 

5460396. 

Schwarz criterion 

14.25244 

Log likelihood 

-506.6727 

F-statistic 

10.87696 

Durbin-Watson stat 

1.679384 

Prob(F-statistic) 

0.000078 


Nous presentons maintenant un exemple qui illustre le calcul de 
la p-value. On veut tester l’hypothese que la moyenne des depenses 
sur cartes de credit est egale a 0, soit HO: 0 = 0 (test bilateral). La 
statistique t, toujours calculee a partir de l’echantillon precedent, est 

, * 262,53-0 , 

egale a: t =-= 7,00. La p-value associee a cette statistique 

37,48 

est: 

p-value(7,00) = 2P[l-P(t < 7,00)] = 2P[l-F(7,00;7l)] = 0,0000, 

ou F est la cdf. Au seuil a = 5 %, on rejette fortement HO car la p-value 
est tres nettement en dega de ce seuil. Par ailleurs, 1’intervalle de 
confiance de (3 est de: 

p ± t c = 262,53 ± 1,99 x 318 j 4 = 262,53 ± 74,58. 

Vn V72 
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Le coefficient de correlation de Pearson pour le cas ou l’on veut 
evaluer la relation lineaire entre les depenses sur cartes de credit et le 
niveau du revenu des individus est de: 

Cov( CARTE, REVENU) 
p = , v L= = 0,44. 

^ V(CARTE) x v(revenu) 

Par ailleurs, le coefficient de correlation de Spearman, calcule par 
Cov(R,S) 

6o„ m , = —-= 0,53. Finalement le coefficient de correlation 

^ ftmsj • s 

de Kendall, calcule par x = — = 0,37. Ces calculs apparaissent au 
tableau 1.3. 


Tableau 1.3 Correlations 




CARTE 

REVENU 

CARTE 

Pearson Correlation 

1.000 

.443** 


Sig. (2-tailed) 


.000 


N 

72 

72 

REVENU 

Pearson Correlation 

.443** 

1.000 


Sig. (2-tailed) 

.000 



N 

72 

72 


** . Correlation is significant at the 0.01 level (2-tailed). 
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Nonparametric Correlations 



REVENU 


CARTE 

Kendall's tau_b 

CARTE Correlation Coefficient 

1.000 

.374** 


Sig. (2-tailed) 


.000 


N 

72 

72 


REVENU Correlation Coefficient 

.374** 

1.000 


Sig. (2-tailed) 

.000 



N 

72 

72 

Spearman's rho 

CARTE Correlation Coefficient 

1.000 

.534** 


Sig. (2-tailed) 


.000 


N 

72 

72 


REVENU Correlation Coefficient 

.534** 

1.000 


Sig. (2-tailed) 

.000 



N 

72 

72 


** . Correlation is significant at the .01 level (2-tailed). 


© 2001 - Presses de l’Universite du Quebec 

a, t-aurier, tnaat 4S9, Quebec, finite 8Wf 2M8 » T<S1.; (418) 6S7-4399 - ww.paq.ea 

fintmciire. Francis-fine Racioot et Raymond TMoret, ISBN 2-7605-1123-5 • D1123N 









© 2001 - Presses de l’Universite du Quebec 

Tir6 : Tmite d'economhtriefincmciere, Franfois-fiifcRacicoUt Raymond Thdoret, ISBN 2-7605-1123-5 • D1 123N 



ANNEXE 


Dans cette annexe, nous voulons demontrer que 1’estimateur a 2 de a 2 
est sans biais, c’est-a-dire: El a 2 1 = a 2 . Supposons une suite de variables 

E(x,-x ) 2 

aleatoires IID(p,, a 2 ) : Xi, X 2 , X n . On a: a 2 = —-. On 

n-1 

elabore le numerateur comme suit: 

£(X-X) 2 = £ [(X, -p)-(x-p)] 2 . On a done: 

flK^-^-fx-p )] 2 

E(a 2 ) = E -i- 

V ’ n-1 

-^7 E [E[( x i->*)-(x-K)] 2 ] 

= J^ E [E[( x i -M 2 - 2 ( x .-v)(x-n)+(x-n) 2 ]J 

= iEI E [?( Xl “^ 2 ' 2n ( x -^) 2+n ( x -ri] 

“[E E ( x i-ri-" E ( x -ri] 
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Par definition, E(Xj - [t) 2 = a 2 et E(X - ^) 2 = V(x) = —. Alors 
on a: 

-r>(~2\ 1 ' 2 no n 2 ° n —1 2 2 

Ea =-) a-=-a-=-a =a 

V ’ n — 1 j n -1 n n-1 n-1 n-1 
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CHAPITRE 


2 

LE MODELE LINEAIRE 
A DEUX VARIABLES 


Ce chapitre vise a presenter le modele de regression lineaire a une 
variable explicative. Dans ce contexte, nous exposerons les moindres 
carres ordinaires (MCO) 1 pour estimer les parametres de cette equa¬ 
tion. Nous nous attarderons aux diverses formes fonctionnelles que 
peut prendre l’equation a estimer ainsi qu’aux tests statistiques et 
intervalles de confiance pertinents. Par la suite, nous dirigerons notre 
collimateur vers les indices de performance d’une regression et les 
diverses techniques de prevision en coupe instantanee. Finalement, 
quelques exemples financiers serviront a illustrer Pestimation du modele 
lineaire a deux variables. 


1. Specification du modele A deux variables 

ET PROPRIETES DES ERREURS RESIDUELLES 

Le terme regression tire son origine de Galton (1889), qui a utilise ce 
terme pour designer le phenomene de regression vers la mediocrite 
qu’il notait dans une etude sur les tailles relatives des individus. Une 
regression lineaire se represente comme suit: 

y t =(3! +|3 2 x t +e t 

Dans cette equation, y t est la variable dependante ou expliquee. x t est le 
regresseur, dite encore variable independante ou explicative, ou 


1. Soit les Ordinary Least Squares (OLS) en anglais. 
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t = 1, T, soit Pindice des observations contenues dans Pechantillon. 
Dans cette equation lineaire, deux parametres sont a estimer: pi et ph- 

Les hypotheses du modele de regression lineaire simple sont les 
suivantes: 

i) e t est une variable aleatoire appelee erreur residuelle IID 
(0, a 2 ). Cette hypothese implique que E(e t ) = 0, Vt; que 
Cov(e t , e s ) = E(e t , e s ) = 0, Vt ^ s 2 ; que V(e t ) = E(e t 2 ) = ct 2 , Vt. 
Cette derniere hypothese est celle de Phomoscedasticite. 
Cette propriete designe la Constance de la variance des erreurs 
residuelles, une fonction scedastique designant une fonction 
de la variance, le prefixe homo se rapportant au caractere 
constant de cette fonction. 

ii) x t est suppose non stochastique, ce qui signifie que dans des 
echantillons repetes, x t est fixe. Cette hypothese implique 
que: Cov(x t ,e t ) = 0 => E(x t e t ) = 0 

La figure 2.1 donne une representation du modele de regression 
lineaire a une variable explicative. 


Figure 2.1 



2. On dit alors que et est orthogonal a e s (ou que e t est independant de e s ). 
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Comme on peut le constater sur cette figure, il n’existe pas de relation 
exacte entre y t etx t . Par exemple, si x t = xi, yi ne tombe pas exactement 
sur la droite de regression. II existe un ecart de ei par rapport a la 
droite qui constitue le terme d’erreur de la regression pour cette 
valeur de x. Et ainsi de suite pour tous les autres x. La droite apparais- 
sant a la figure 2.1 est l’esperance mathematique suivante: 

E (y t ) = Pi+P2 x t 

en vertu des hypotheses precedentes. La variance de y t est donnee par 
l’expression suivante: 

v(y,) = e[( 7 , - E(y, )) 2 ] = E[(y, - fi, - ) 2 ] = E(e;) = <r 

Par consequent, la variance de la variable aleatoire y t se confond avec 
celle des erreurs residuelles, c’est-a-dire: y t ~ IID (Pi + P 2 x t , u 2 ) 


2. Estimateur des MCO 

On vise a estimer les parametres Pi et P 2 du modele lineaire de 
regression a deux variables. La regie de la minimisation de la somme 
des erreurs residuelles au carre introduite au chapitre 1 est de nouveau 
utilisee ici. Elle se formule comme suit: 

MinS(p i ,P 2 ) 

Pi >p2 


ou S(P 1 ,P 2 ) = J^e^ = J2(y t -P j- p 2 x t) • En elaborant le carre de 

t=i t=i 

S, on obtient: 

S(Pi,P 2 ) = £y? +T Pi +P2^ x i -2Pi^y t -2p 2 ^x t y t +2p i p 2 ^x t . 

Pour minimiser S(.), il suffit de calculer les derivees partielles de cette 
fonction par rapport aux deux parametres et de les egaler a zero, c’est- 
a-dire : 


_3S_ 

Wi 


2T Pi -2£y t +2P 2 £x t ; — = 2P 2 £x 2 -2^x t y t + 2 $^^ 
t t 0P2 t t t 
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as 


=>-2(-Tp l +£y,-p ! £x,) = 0 


= 0 



-2(-P2Eif+£yA-P 1 £i,) = o 


sp 2 


Ces deux equations peuvent etre reecrites comme suit: 


I(yt-Pi-P2x t ) = Ea t =o 

L( x t S t) = 0 


Ces deux equations sont appelees : equations normales. Exprimee sous 
forme vectorielle, la derniere equation s’ecrit: x T e = 0. Un vecteur tel 
que e, orthogonal a tout vecteur de Phyperplan engendre par x, est dit 
normal a Phyperplan. D’ou le qualificatif « normal x>. 

Pour determiner (3, et (3 2 , on solutionne les deux equations 
normales pour ces deux inconnues. Selon la premiere equation nor- 
male, on a: 


^e t = 0 => ^y t = TPj +P 2 £x t 
En multipliant cette equation par £x t ,ona: 


^x t ^y t = ^x t TPj + ^x t ^x t j3 2 Par ailleurs, selon la deuxieme 
equation normale: 


L(x t et) = 0=>£x t yt = £x t pi+^x;p 2 


En multipliant cette equation par T et en soustrayant le dernier 
resultat de cette equation, on a: 


T E*,y,-E*,E y .^(T Ix HE*.) 2 ) 


II en resulte que: 
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On peut simplifier cette expression de la fagon suivante: 


a _ T (L( x t- x )(y t -y)) 

(H(^c-g)(y« -y))/( T ~l) 

(£(x t -x) 2 )/(T-l) 

_ Cov(x,y) _ 6^ 

V(x) C 2 X 

Connaissant P 2 ,on deduit (3, a partir de la premiere equation normale 
en la divisant prealablement par T: 



3. Proprietes des MCO 


On peut representer sous forme matricielle 1’equation de la regression 
lineaire: 


y = Xp + e 



X 1 



Pi 


,P 2 
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De fagon equivalente, on peut representer ce systeme comme suit: 


y = x 1 (3 1 +x 2 (3 2 +e = [x 1 



+ e = X(3 + e 


ou e ~ IID ( 0 , ct 2 I) : E(e) = 0 et V(e) = E(ee T ) = ct 2 I. Comme aupara- 
vant, X est une matrice de variables non stochastiques. 

Sous forme matricielle, l’estimateur des MCO s’ecrit comme suit: 

P = (X T X) X T y 

Les proprietes des MCO sont les suivantes: 

i) les MCO sont sans biais sous les hypotheses enoncees ci- 
devant. Cette propriete se demontre comme suit 3 : 

|3 = (x T x)"‘ X T (xp + e) = (x T x)"‘ X 1 Xfi + (x T x)"‘ X T e 
= P + (x T x) _ ‘x T e 

L’esperance de (3 est done de: 

E(p) = E(p + (X T X) _1 X T e) = p + (X T X)“ 1 X T E(e) = p 

cette derniere operation se justifiant par le caractere non stochastique 
de X. II s’ensuit que le biais de p, donne par: biais I (3 J = Elm-13, est 
egal a zero. 

ii) L’estimateur p est un estimateur lineaire. En effet: 

P = (x T x)" 1 X T y = Ay = f(y) 
la fonction f(.) est une fonction lineaire de y. 


3. Les principales regies du calcul matriciel concernant ce chapitre apparaissent 
dans l’appendice de celui-ci. 
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iii) A l’interieur de la classe des estimateurs lineaires sans biais, 
les MCO sont efficients, c’est-a-dire que pour tout autre 
vecteur (3* associe a un autre estimateur lineaire, on a: 

v(c T i>)<v(c T H 

ou c'(3 est une combinaison lineaire des coefficients estimes par la 
methode des MCO. Dans le cas qui nous concerne, c T (3 est egal a: 


c t P = [cj 


Si la variance de cet estimateur est egale a celle des MCO et que cet 
estimateur est sans biais, cet estimateur ne peut etre que celui des 
MCO. 

II convient maintenant de calculer la matrice variance-covariance 
de p.Ona: v(|S) = L(|i)j (|i- 1 l(|!))' J. Sachant que 

P - P = (x T x) _1 X T e, on a: 


r(p) = 


jJx T x)~'x T e|(x T Xp' 


= e[(x t X ) -1 X T ee T x(x T X )” 1 j 
= (x T x ) -1 X T E (ee T )x(x T x ) -1 


= o 2 X T X) 


Les principals regies du calcul matriciel apparaissent dans 
l’appendice. 

Telles sont les principals proprietes de 1’estimateur des moindres 
carres ordinaires. II importe de specifier la composition de la matrice 
variance-covariance de (3. 
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(M(p)(M(p) 

[Pi-Pi P2-P2 

P2-P2J 

(p,-p,) 2 (Pi— p,)(p 2 — P 2 ) 

(P2-P 2 )(Pl-Pl) (P2-P2f 

e(p, -P,) 2 e((p, -p,)(p, -P,)) 

e((p 2 -P2)(Pi-P,)) E(p,-p,) 2 

v(p,) Cov 


Cov(pJ 2 ) V(p 2 ) 


Etant donne que 1’on se situe encore dans le cas de la regression a 
deux variables, on peut representer, comme on l’a vu anterieurement, 
la matrice variance-covariance 4 de fagon compacte comme suit: 

Cov(p) = a 2 (x T x) _1 
ou X = [i x]. Plus explicitement: 


4. A noter que l’on utilise indifferemment Cov(.) ou V(.) (en gras) pour designer la 
matrice variance-covariance. 
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Cov(p) = a 2 [[i x] T [i x]] 



ou i T i = T. On a finalement: 


Cov(p) = 
Cov(p) = o 2 


T Z*. 

E*. E*; 

E^ 


t E( x .- x )’ Eb. 


E(-.--) Eb. 


Pour calculer la covariance de (3, il suffit maintenant d’estdmer ct 2 . On 
a le modele suivant: 


y = P 1 i + (3 2 x + e 

En appliquant les MCO sur ce modele, on obtient le vecteur des 
erreurs residuelles: 

e=y-y=y-Xp 
e = y - X(X T X)‘ 1 X T y = My 

ou M = (I - X(X T X) _1 X T ). Cette matrice a la propriete d’etre syme- 
trique et idempotente. On a egalement: 

MX = 0 
e = My = Me 
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D’ou: 



T-2 T-2 


a 2 etant un estimateur non biaise de ct 2 , on a 



Demontrons ce resultat. 



Elaborons le numerateur de cette equation. 


E(e T e) = E(e T M T Me) = E(e T Me) = E(tr(e T Me)) = E(tr(Mee T )) 


•(ME(ee T )) = tr(Ma 2 i) = tr(Ma 2 ) = a 2 tr(M) = a 2 (T-2) 




ou tr(M) = tr(I) - tr(X(X T X)- 1 X T ) = tr(I) - tr(X T X(X T X)-') = T - 2. 


En substituant ce resultat dans l’esperance de a 2 , on a: 



II va de soi que la demonstration est la meme dans le cas multivarie 
(plusieurs variables explicatives). 

4. Tests d'hypotheses et intervalles de confiance 

De maniere a construire les tests d’hypotheses et les intervalles de 
confiance sur le modele de regression suivant: 


= (3 t + (3 2 x t + e t 


il faut identifier la distribution des residus. En vertu du theoreme 
central-limite, on suppose que e t ~ NID(0, ct 2 ). Nous rappelons que 
cette specification peut etre verifiee empiriquement par le test Bera- 
Jarque. Si e t ~ NID(0, ct 2 ), en vertu des MCO, on peut ecrire: 


© 2001 - Presses de l’Universite du Quebec 


Edifice 1^ Delta-f, 2875, Soul Iajner, bgmai 450, Quebec, QnaiecG1V 2M2 • T^l (418)657-439*)-www.pnq.ca 

Tirt: Traite d'ecunomelrie fimmciire, Fransois-Eric Racicot et Raymond Thdoret, ISBN 2-7605-1123-5 • D1123N 





Le modele lineaire a deux variables 79 


P, - N(p 1 ,v(p.)); k - n(p 2 i v(p 2 )) ou: v(p,)= ; 

T L( x t- x ) 


v(p 2 ) = —r; Cov(iU 2 ) = —^ 

L( x t- x ) L( x t- x ) 

On dispose maintenant des outils pour construire les tests. On 
applique la meme procedure qu’au chapitre precedent. Etant donne la 


distribution de (3 2 , 


. P 2 -P*- 

' fiN 

P 2 -P; 


~N(0,l). Mais comme ct 2 est 
t(T-2) ou on a remplace 


generalement inconnu, on a 

V(.) par V(.) et ou ct 2 est estime par c 2 = . Par consequent, 

T -2 

l’intervalle de confiance pour p 2 est de: 

(3 2 e^ 2 -t c Jv|p 2 j, P 2 +t c ^|v|p 2 j j. De fagon plus concise, on 
peutecrire: |3 2 ±t v(p 2 ). 


5. Prevision 


5.1. Prevision de E(y 0 ) 

On veut prevoir les depenses moyennes a partir des cartes de credit 
designees par E(yo) en fonction du revenu moyen represente par xo. 
Dans le cadre du modele de regression lineaire, on a: 

yo = Pi + P2xo + e 0 

ou e 0 ~ N(0, ct 2 ) => yo~N(p! + p 2 x 0 , a 2 ) 
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Par consequent, 

E (y 0 ) = Pi + Mo => y 0 = E (y 0 )+ e o 

yo est constitue de deux parties: i) E(y 0 ), soit les depenses moyennes 
a partir de cartes de credit pour un revenu yo; ii) eo, une erreur hors- 
echantillon. La valeur exacte de yo est done inconnue car (3i, P 2 et eo 
sont inconnus. Par contre, on obtient ^ et j3 2 par les moindres carres 
ordinaires et on sait que E(eo) = 0 et que cette erreur n’est correlee 
avec aucune autre, i.e. Cov(e 0 ,e t ) = 0 Vt ^ 0. L’estimateur de E(yo) 
est obtenu en remplagant Pi et p 2 par et (3,. On obtient done la 
prevision suivante: y 0 = E(y 0 ) = jij + (3 2 y 0 - L’estimateur y 0 est un 
estimateur sans biais de yo puisque: 

E (y 0 ) = E (Pi) + x o E (P 2 ) = Pi + p 2 x o- En fait, l’estimateur E(y 0 ) est 
le meilleur estimateur lineaire de E(yo). 

La variance de cet estimateur se calcule comme suit: 

v (y 0 ) = E [yo- E (yo)]“ = e (( x o T (p-p))( x o T (p-p)) t ) 


ou x 0 


1 ] [Pi 

et P = 


h. 


V(y 0 ) = E[x 0 T (p-p)(p-p) T 


= a'x n 1 X A X x n = cr 


1 (xo -xf 


L’estimateur deV(y 0 ) est V(y 0 ) = cr 


1 , ( x o~ x ) 

T EK-* 
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Fort de ces resultats, nous sommes en mesure de construire 
1’intervalle de confiance de E(yo): 

y 0 ±tjv(y 0 ) 

Cet intervalle est represente a la figure 2.2. 


Figure 2.2 



5.2. Prevision de y 0 

Nous voulons predire les depenses effectuees a partir de cartes de 
credit et non les depenses moyennes comme dans la section prece- 
dente pour un revenu xq donne. On a le modele suivant: 

y 0 =Pi +P 2 x o + e o 

Pour obtenir la prevision de yo, on procede comme dans la section 
precedente. On obtient: 

y 0 =Pi+P2 x o 
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On calcule ici la variance de l’erreur de prevision. 


V(y 



6. MESURES DU DEGRE D'AJUSTEMENT 

La mesure la plus utilisee pour evaluer le degre d’ajustement d’une 
regression est le coefficient de determination, designe par R 2 . II se 
definit comme suit: 



On peut demontrer cette relation comme suit. Soit le modele de 
regression suivant: y t = Pi + P 2 Zt + e t . On exprime ce modele en 
deviation de la moyenne et on obtient: y t - y = Pi + P 2 x t + e t - y, ou 


y = Pj + P 2 x. On a aussi: y t - y = y t - y + e t . 


D’ou: y t -y = |3 2 (x t -x) + e t . En elevant au carre cette derniere 
equation et en sommant, on obtient: 




SCT = SCE + SCR 


ou SCT designe la somme des carres totale, SCE, la somme des carres 
expliques et SCR, la somme des carres residuels. En divisant les deux 
cotes par SCT, on a: 
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SCE | SCR _ r2 | SCR 
SCT SCT SCT 


R 2 = 1-, 5 Pour sa part, le R 2 

SCT 


ajuste de Theil se calcule comme suit: 


T-2 _ 1 °e 


T-l 

On notera que 1’on a ici corrige pour les degres relatifs de liberte. Le 
R 2 traditionnel augmentera tant que l’on ajoutera des variables meme 
si celles-ci sont non significatives, alors que le R 2 ajuste penalise l’ajout 
de variables explicatives a un modele, qu’elles soient significatives ou 
pas. 

Le R 2 s’interprete comme suit. Dans le cas de deux variables 
aleatoires, ce coefficient est egal au coefficient de correlation de Pear¬ 
son au carre. II mesure done la force du lien entre les deux variables. 


(E(*t- x )(yt-y )) 2 

L(y.-y) 2 E( x .-y ) 2 


E(M *,-*)) 2 

E(y,-y ) 2 


= p 2 . Dans le cas 


ou il existe plusieurs variables explicatives, il mesure l’effet qu’ont les 
variations des variables explicatives sur la variable dependante. Par 
exemple, si R 2 est egal a 30 %, cela signifie que 30 % de la variance de 
la variable dependante est attribuable a la variance de l’ensemble des 
variables explicatives. 


Autres formes fonctionnelles pour la relation 
depenses sur carte de credit et revenus 
qui se ramenent au modele lineaire standard 

Le modele de regression lineaire qui vient d’etre expose ne s’applique 
pas seulement a 1’equation decrivant une relation lineaire entre deux ou 
plusieurs variables. En effet, certaines formes fonctionnelles peuvent 


5. Ce R 2 est dit centre car il est calcule en deviation de la moyenne. 
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etre linearisees tres facilement. Une fois cette transformation operee, 
on peut alors estimer ces equations par les MCO. Voici les formes 
fonctionnelles les plus courantes qui sont facilement linearisables. 

1) Forme quadratique 

La forme quadratique s’ecrit comme suit: 

y t = (3i+(3 2 Xt+e t 

Le graphique de cette relation apparait a la figure 2.3. 


Figure 2.3 


y t ' 1 E( yt ) = Pj + p 2 x? 



Mettre les donnees au carre pourrait viser a capter les non- 
linearites que pourraient incorporer les donnees. La contribution 
marginale de x dans l’explication de y est evaluee par la derivee pre- 


• dy t 

miere, soit: - 


dx t 


= 2(3 2 x t . On voit ici que la derivee n’est pas cons- 
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tante mais proportionnelle a x. La derivee seconde: 



Dans cet exemple, (3 2 est positif. On peut ramener cette forme a la 
formulation standard anterieure du modele de regression par la simple 
transformation suivante: z = x 2 . D’ou on obtient: y t = Pi + [3 2 z t + e t . 
Du point de vue de la regression, on retrouve le modele lineaire bien 
comm. 


2) La forme log-lineaire (exponentielle) 

Cette relation s’exprime comme suit: 

y t = exp((3j + (3 2 x t + e t ) 

Par la transformation logarithmique, on obtient le modele lineaire 
suivant: 


lny t = Pi + P 2 x t + e t 

La forme log-lineaire contribue a corriger les problemes d’asymetrie 
au chapitre de la distribution empirique des observations ayant trait a 
la variable dependante. Elle permet egalement de stabiliser la variance 
de la variable dependante. 


3) La forme semi-log 

Cette forme s’ecrit comme suit: 

ex p(y t ) = ex p(Pi+ e t) x t p2 

Apres transformation logarithmique, on obtient: 

y t =p 1 + p 2 ln(x t ) + e t 

Cette forme peut servir au traitement du probleme de l’heteroscedas- 
ticite dont il sera question dans un autre chapitre. 
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4) La forme log-log 


Cette forme s’ecrit comme suit: 


exp(y t ) = a t Xj 2 exp(e t ) 

En appliquant la transformation logarithmique, on obtient: 
lny t = (3 X + (3 2 lnx t + e t 

ce qui se ramene a un modele lineaire standard. Cette forme est 
souvent utilisee pour representer les fonctions de demande et de 
production (type Cobb-Douglas). En valeur absolue, l’elasticite de la 


fonction est ici mesuree par: 


dlny t 

|dlnx t 


dy t 

y t 

dx t 

x t 


|P 2 |. Quand |(3 2 1 > 1, la 


fonction est dite elastique. Dans le cas inverse, elle est dite inelastique. 


L’elasticite est un concept que l’on retrouve frequemment en 
finance. A titre d’exemple, dans la theorie des options, on peut calcu- 
ler l’elasticite du prix d’une option d’achat ou de vente. Pour l’option 
d’achat, l’elasticite de son prix a celui de Faction sous-jacente se 
calcule comme suit: 


3c 

c 

as 

s 


= |N(d.) 


ou c represente le prix de l’option d’achat; S, le prix de Faction sous- 
jacente et N(di), la probability cumulative sous la normale de moins 
l’infini a di 6 7 . Briys et al. 1 donnent l’exemple suivant. On suppose que 


6. Pour plus de details sur ce sujet, voir: Racicot, F.-E. et R. Theoret (2000), Traite 
de gestion de portefeuille: titres a revenus fixes etproduits derives, Presses de 1’Univer- 
site du Quebec, Ste-Foy, chap. 6. On consultera egalement: Briys, E., M. Bellalah, 
H.M. Mai et F. de Varenne (1998), Options, Futures and Exotic Derivatives: 
Theory, Application and Practice, Wiley, New York. 

7. Briys et al., op. tit. 
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S = 18, X = 15, rf = 10 %, T = 0,25, a = 15 %. Alors, N(2,8017) = 0,997 
et c = 3,3659. Alors, F elasticity du prix de Foption d’achat est de: 

18 

elasticite =-xO,997 = 5,3317. L’elasticite indique le change- 


3,3659 


ment procentuel du prix de l’option quand le prix de Faction varie de 
1 %. Ici, un accroissement de 1 % du prix de Faction, c’est-a-dire de 
0,18, induitun accroissement de 5,33 % au chapitre du prix de Foption 
d’achat. II s’ensuit que lorsque le prix de Faction passe de 18 a 18,18, 
le prix de Foption d’achat se voit modifie de 3,3659 a 3,5453 (3,3659 
X (1 + 0,0533)). Pour sa part, l’elasticite du prix de Foption de vente 
se calcule comme suit: 


S 3p Sr , , i 
elasticity =-= — [N^dj j-lj 


p 3S p 


En utilisant les donnees precedentes, on obtient le resultat suivant 
pour Felasticite du prix de Foption de vente: 

18 

-[0,997 — l] = -12. Cela signifie que le prix de Foption de 

vente diminue de 12 % quand le prix de Faction augmente de 1 %. 

5) La forme reciproque 

Cette forme s’ecrit comme suit: 



Cette specification est notamment utilisee pour estimer la courbe 
de Phillips, qui est la relation entre Finflation et le taux de chomage. 
La representation graphique de cette fonction pour le cas ou (L est 
positif apparait a la figure 2.4. 


© 2001 - Presses de l’Universite du Quebec 


Edifice Ijs Delta-1,2875, boul lamer, bureau 450, Quebec, CMheo01V2M2-TO (418)657-439*)-www.pnq.ca 

Tirt: Traite d'ecunomelrie fimmciire, Fransois-Eric Raoioot et Raymond Thdoret, ISBN 2-7605-1123-5 • D1123N 



88 Traite d’econometrie financiere 


Figure 2.4 



6) La forme log-inverse 

Cette forme s’exprime comme suit: 


y t = exp^i + p 2 — + e t 

En appliquant la transformation logarithmique sur cette forme, on 
obtient: 


ln (y t ) = Pi + P 2 — + e t 

x t 

Cette forme s’apparente beaucoup a la forme reciproque sauf que la 
variable dependante est exprimee sous forme logarithmique. Quand x 
augmente, ln(y t ) diminue. 
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7. Applications 


Fort des enseignements precedents, nous revenons dans ce chapitre a 
1’exemple des depenses sur carte de credit. On doit effectuer une 
regression du type suivant: 

y t = Pi + (3 2 x t +e t 

ou y t represente les depenses moyennes mensuelles sur carte de credit 8 
et x t , le revenu des detenteurs de carte. Sur le fielder original, celui-ci 
est exprime sur une base annuelle et est divise par 10000. On regresse 
cette equation selon les MCO, qui comprennent 72 individus. Le 
resultat est presente au tableau tableau 2.1. 

Tableau 2.1 


Dependent Variable: CARTE 

Method: Least Squares 

Date: 04/13/00 Time: 18:10 

Sample :1 100 IF X3 >0 

Included observations: 72 

Variable 

Coefficient 

Std. Error t-Statistic 

Prob. 

C 

-22.50933 

76.78067 -0.293164 

0.7703 

REVENU 

82.93119 

20.05219 4.135768 

0.0001 

R-squared 

0.196368 

Mean dependent var 

262.5321 

Ajusted R-squared 

0.184888 

S.D. dependent var 

318.0468 

S.E. of regression 

287.1440 

Akaike info criterion 

14.18523 

Sum squared resid 

5771618. 

Schwarz criterion 

14.24847 

Log likelihood 

-508.6683 

F-statistic 

17.10458 

Durbin-Watson stat 

1.668577 

Prob(F-statistic) 

0.000097 


A la lecture du tableau 2.1, on constate que le R 2 (R-squared) est 
de 0,20. Pour sa part, le R 2 ajuste se situe a 0,18. Comme il s’agit ici 
de donnees microeconomiques, on s’attend a des R 2 plutot moderes, 
de 1’ordre de 0,25. En depit du caractere tres modere du R 2 , on 
observe que le coefficient associe au revenu, a hauteur de 82,9, a une 


8. Soit les depenses annuelles divisees par 12. 
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statistique t significative egale a —--= 4,14 avec 70 degres de 

liberte et une p-value de 0,00, inferieure au seuil critique de 0,05. 
Pour illustrer, considerons deux exemples. 


Exemple 1 

On veut maintenant prevoir les depenses sur carte de credit associees 
a un niveau de revenu de 40 000$. Les depenses prevues pour ce 
niveau de revenu seront de: 


y 0 =-22,51 + 82,93 


40 000 
10 000 


Nous voulons calculer Pintervalle de confiance de cette prevision. 
Nous devons done evaluer la variance de celle-ci. Elle est egale a: 


v(y«) = 


1 i (4,00-3,44) 
72 


205,06 


< (287,14) 2 =1269,76 


L’intervalle de confiance de la prevision de E(yo ) est done de: 
309,21 ±1,99^/1269,76 ou 1,99 est le t critique correspondant a 
70 degres de liberte. 


Exemple 2 

L’exercice suivant vise a calculer le ratio de couverture optimal a 
partir de contrats a terme. Les contrats choisis sont les BAX qui sont 
transiges a la Bourse de Montreal. Ces contrats sont ecrits sur des 
acceptations bancaires a trois mois. Nous disposons de donnees jour¬ 
nalises sur le prix de ce contrat pour 1’annee 1999, ce qui equivaut a 
250 observations. De fagon a calculer le ratio de couverture optimale, 
on recourt a la methode de l’appariement des positions au comptant et 
a terme. En vertu de cette methode, le nombre optimal de contrats a 
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terme (NF) que l’on doit detenir pour couvrir de fagon optimale le 
nombre de contrats detenus au comptant (NS) est de: 

, , AS , , AS a s 

NF = — x NS . Or, — = p SF — = y. On peut calculer ce coeffi- 
AF AF a F 

cient en regressant S sur F, c’est-a-dire: S t = X + yF t + e t . Pour la 
periode 1999, on obtient 1’estimation suivante: 

S t = 76,00 + 0,24F t + e t . Entre parentheses, on retrouve les statis- 

(606) (184) 

tiques t. La Durbin-Watson est de 1,77 et le R 2 est 0,99, ce qui 
indique que les series semblent cointegrees 9 . Le ratio de couverture, 
a hauteur de 0,24, est done plutot faible pour cette periode mais 
historiquement, on remarque qu’il peut beaucoup fluctuer, du moins 
a en juger par certaines etudes de la Banque du Canada 10 . 


Exemple 3 

L’exemple suivant est un test de la relation du CAPM * 11 . On suppose 
qu’il existe un actif sans risque dont le taux d’interet est de rf. On a la 
relation suivante qui relie le rendement espere du titre i a celui du 
portefeuille du marche 12 : 

E(r,) = r f +P,[E(r„)-r f ] 

ou E(rj) est le rendement espere du titre i, (E(r m )-rf), la prime de 
risque du portefeuille du marche, E(r m ) etant le rendement espere du 
portefeuille du marche et Pi, le beta du titre i. Cette equation est 
appelee SML (Security Market Line). Cette relation exprime la relation 


9. Pour l’explication de ce concept, voir le chapitre 9. 

10. Watt, D.G. (1997), Canadian Short-Term Interest Rates and the BAX Futures 
Market: An Analysis of the Impact of Volatility on Hedging Activity and the 
Correlation of Returns between Markets, document de travail, Banque du Canada. 

11. On retrouvera ce test dans Benninga, S. (1997), Financial Modeling, MIT Press. 
Pour une introduction au modele du CAPM, on consultera: Gagnon, J.M. et 
N. Khoury (1988), Traite de gestion fmanciere, 3 e edition revisee, Gaetan Morin, 
Boucherville, chap. 8. 

12. A noter qu’il est tres courant de deduire le taux sans risque du rendement espere 
du titre i pour formuler la SML. Benninga (1997) n’a toutefois pas retenu cette 
approche. 
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d’equilibre entre le rendement espere du titre i et son risque. Selon le 
CAPM, cette relation est lineaire. Pi mesure la sensibilite du rende¬ 
ment du titre i a celui du portefeuille du marche. Plus Pi est important, 
plus le rendement espere du titre i reagit a une variation donnee du 
rendement espere du portefeuille du marche. On estime le beta a 
partir de l’equation suivante: 

r it = a ; + Pir mt + e it 

On suppose les hypotheses habituelles pour le terme d’erreur, entre 
autres e t ~NID(0,cr 2 ), ce qui est une hypothese de base du CAPM 13 . 
Pour estimer cette equation, on dispose de la matrice de donnees qui 
apparait au tableau 2.2. 

Tableau 2.2 

AMR BS GE HR MO UK S & 


1974 -0,3505 -0,1154 -0,4246 -0,2107 -0,0758 0,2331 -0,2647 

1975 0,7083 0,2472 0,3719 0,2227 0,0213 0,3569 0,3720 

1976 0,7329 0,3665 0,2550 0,5815 0,1276 0,0781 0,2384 

1977 -0,2034 -0,4271 -0,0490 -0,0938 0,0712 -0,2721 -0,0718 

1978 0,1663 -0,0452 -0,0573 0,2751 0,1372 -0,1346 0,0656 


1979 -0,2659 0,0158 0,08 


0,0793 0,0215 0,2254 0,1844 


1980 0,0124 0,4751 0,3350 -0,1894 0,2002 0,3657 0,3242 

1981 -0,0264 -0,2042 -0,0275 -0,7427 0,0913 0,0479 -0,0491 

1982 1,0642 -0,1493 0,6968 -0,2615 0,2243 0,0456 0,2141 

1983 0,1942 0,3680 0,3110 1,8682 0,2066 0,2640 0,2251 


13. Si 1’on exclut cette hypothese, il faut supposer que la fonction d’utilite des 
individus est quadratique, ce qui semble cependant une hypothese encore plus 
restrictive que celle de la normalite du terme d’erreur. 
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ou AMR: American Airlines; BS : Bethlehem Steel; GE: General 
Electric; HR: International Harvester; MO : Philip Morris; UK: 
Union Carbide; S&P’s: 1’indice Standard & Poor’s 500, considere ici 
comme 1’approximation du rendement du portefeuille du marche. 

Les rendements sont calcules par la formule suivante: r t = In 

Precisons davantage la methode d’estimation des betas. Nous sommes 
ici conffontes a 6 compagnies, done 6 actions. Dans l’equation prece- 
dente, i = 1, ..., 6. Nous disposons de dix annees. Considerons le 
calcul du beta de la premiere compagnie (i = 1), ici AMR. Sous forme 
matricielle, la regression s’ecrit comme suit pour cette compagnie: 

r i =a 1 +(3 1 r s&p , s +e 1 



r r ll 


"-0,3505" 




"-0,2647" 

r i2 


0,7083 


r m2 


0,3720 



v 0,1942 , 




v 0,2251 y 


Les regressions des rendements des compagnies sont effectuees par 
les MCO. On obtient alors le vecteur suivant des betas estimes pour 
ces six compagnies: 
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V 


' 1,48" 



1,08 

03 


1,31 

P 4 


1,30 

05 


0,26 



^0,49 y 


Par ailleurs, pour estimer E(r;) dans la relation du CAPM, on calcule 
la moyenne des rendements sur Pensemble de la periode pour la 
10 

E* . 

compagnie i: r ; = —— = E(r ; ). Pour l’ensemble des six compagnies, 


on obtient: R = 


^ r," 


( 0,2032" 

r 2 


0,0531 

f 3 


0,1501 

r 4 


0,1529 



0,1025 

^6 j 


^0,1210, 
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Une fois les vecteurs R et (3 estimes v on peut estimer la prime de 
risque du marche en regressant R sur (3 et sur une constante, qui est 
supposee le taux sans risque. On obtient: R= r f + [E(r m ) - r f ]P + e, 
soit: E(q) = 0,0766 + 0,0545(3,. Si la constante est fe taux sans risque 
et comme la prime de risque estimee est egale a 0,0545, on peut 
deduire 1’esperance du rendement du marche comme suit: E(r m ) = 
0,0766 + 0,0545 = 0,1311. 

La statistique t de la constante est de 1.61 et celle de la prime de 
risque, 1,24. Le R 2 est de 0,28 et le R 2 ajuste, de 0,10. On en conclut 
que ce modele n’est pas verifie si l’on en juge par la faiblesse des 
statistiques t et du R 2 . Notons cependant que le nombre de degres de 
liberte est tres reduit mais il n’en reste pas moins qu’avec un echan- 
tillon plus grand, les conclusions pourraient etre similaires. Nous 
avons egalement recouru ici a une methode d’estimation tres simple. 
Nous aurions pu sophistiquer davantage en recourant aux techniques 
du panel et a leurs variantes. Pour estimer le beta de chaque titre, on 
aurait pu se servir de la technique ARCH-M sur chaque serie en 
ajoutant la racine carree de la variance conditionnelle dans l’equation 
qui sert a estimer le vecteur (3. Cette procedure sera analysee au 
chapitre 10. 
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CHAPITRE 


3 

LE MODELE LINEAIRE GENERAL 


Jusqu’ici, nous ne nous sommes interesses qu’a une seule variable 
explicative. Le chapitre que voici se veut plus general en introduisant 
plusieurs variables explicatives. Encore une fois, ce chapitre se penche 
sur les problemes d’estimation, de specification, d’inference et de 
prevision. Lorsque l’on passe au niveau de plusieurs variables explica¬ 
tives, force est d’utiliser le calcul matriciel. Les principes du calcul 
matriciel sont presentes a l’annexe de ce chapitre. 


1. Formulation matricielle 

ET HYPOTHESES DE BASE 

Soit le modele lineaire suivant, qui incorpore plusieurs variables expli¬ 
catives : 


y t = (3 x x tl + (3 2 x t2 +... + Ptx^ + e t 

ou x t i = 1, Vt. Si l’on dispose de T observations sur y t et les x^, on 
peut ecrire: 


Yl = Pi + P2 X 12 + P3 X 13 + - + Pk x lk + e l 
y 2 = Pi + P 2 X 22 + P 3 X 23 + ••• + Pk x 2 k + e 2 


y T = Pi + P 2 x T 2 + Pb x T 3 + - + Pk x Tk + e T 
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En exprimant ce systeme d’equations sous forme matricielle, on 


Vi 


1 X !2 X 13 

x lk " 



A" 

Yi 

= 

1 x 22 x 23 

• x 2k 


+ 

e 2 

JT ) 


^1 x T2 x T3 

■ x Tk / 

A; 


^ e T> 


Sous forme compacte, ce systeme s’ecrit: 

y = X(3 + e 

Les hypotheses de base du modele classique lineaire general de la 
regression multiple sont les suivantes : 

i) Les innovations e sont IID ~ (0, ct 2 It)- Cette hypothese 
implique que E(e); V(e) = E(ee T ) = ct 2 It. Cette hypothese 
implique qu’il n’y a pas de correlation entre les residus: 
Cov(e t , e s ) = 0, Vt^s. Deplus, a 2 = a 2 ,Vt,s. C’est la l’hypo- 
these de l’homoscedasticite des residus. 

ii) Les variables explicatives x sont supposees non stochastiques, 
c’est-a-dire qu’elles sont fixes dans des echantillons repetes. 
Cette hypothese implique que E(x T e) = 0 . Cette hypothese 
est necessaire pour assurer que l’estimateur des MCO sera 
sans biais. C’est aussi une condition de moments utilisee 
dans la methode des moments generalises (GMM) qui sera 
traitee au chapitre 11. 

On veut estimer le parametre p du modele de regression: 
y = Xp + e. A l’instar du chapitre 2, la methode des MCO consiste a 
solutionner le probleme de minimisation suivant: 

T T 

MIN S(p) = MINV e 2 , ou Y e 2 t = e T e- On a: 

P P ^ 
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e T e = (y-X[S) T (y-X[S) 

=(y T -P T x T )(y-xfj) 

= (y T y - y T Xp - |3 T X T y - P t X t X|3) 

= y T y-2(3 T X T y-(3 T X T X(3 
Pour calculer p, on calcule la derivee suivante: 

9S(p) tt- 

-= -2X y - 2X Xp. On egalise ce resultat a zero et on obtient: 

ap 

(3 = (X ' X) X T y. Precisons ce calcul en introduisant les formes 
quadratiques et les techniques de derivation matricielle. 

D’abord la forme quadratique. Sa forme generale est la suivante: 
x t Ax = ajj, ou A estune matrice symetrique. Soit 1’exemple 

suivant ou i = 1, 3 et j = 1, 3. Soit A = X T X, cette matrice etant tiree 
de l’estimateur des MCO et x = p dans cette forme quadratique. Par 
consequent: 

P Ta P = = t(PiPi a b +P2P j a 2 j +P 3 P j a 3j ) 

= (Pl a ll +P2Pl a 21 +P3Pl a 3l) + 

(p 2 Pl a 12 +p2 a 22 +p3p2 a 32) + (P3Pl a 13 +P 3 p2 a 23 + Pl a 33 ) 

Parce que A est une matrice symetrique, on a: 

P T AP = a n Pj +2a 12 P!P 2 +2a 13 P i P 3 

+ a 22 (3 2 +2a 23 P 2 P 3 

+ a 33Pl 
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La derivee de la forme quadratique s’effectue comme a l’accou- 
tumee, c’est-a-dire: 

'a(p T Ap)' 


a(p T Ap) 




3Pi 

a(p T Ap) 


3 D 2 

3 (p T Ap) 


3P, 


a ll a 12 a 13 

V 

a 12 a 22 a 23 

P 2 

^ a 13 a 23 a 33 y 



= 2 A (3 = 2 X 1 X( 3 . 


C’est la la derivee recherchee qui constitue le second terme de 

; en la faisant certes preceder d’un terme negatif. Pour sa part, 

3(3 

son premier terme se calcule comme suit. Posons: 

a(p T x T y) a(p T a) 

—i- - = —i- L , cette substitution: 

3(3 3(3 


= X T y 


^ a 3, 

etant effectuee pour simplifier les calculs. On a done: (3 T a = (3 1 ai + 
$ 2^2 + (Las. La derivee partielle recherchee se reduit done a un simple 
calcul habituel, c’est-a-dire: 


3(P T a)l 


ap, 


a i 

3(|3 T a) 



3P 2 



3(p T a) 


a 

I ^ j 
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Nous avons done demontre comment calculer la derivee recherchee: 


3S(P) 

ap 


-2X T y - 2X T X(3 


Comme cela a ete evoque plus haut, en egalant cette derivee a 0, on 
obtient sous forme matricielle les equations normales enoncees au 
chapitre 2, e’est-a-dire: 


X T y = X T XP 

^M(X T xfx T y 

ce qui est l’equation des MCO. En developpant les matrices, on 


V 


£ x u 

E X tl X t2 ’ ' 

£ X tl X tk 


X x ti7t" 



£ X tl X t2 

£ X ?2 • ■ 

' ' X X t2 X tk 


£ x t2y t 



X x ti x tk 

£ X t2 X tk • ■ 

' ' £ X tk , 


X Xtkyt y 


Pour etre certain d’obtenir un minimum, on requiert la condition 

a 2s (p) 

second ordre suivante: -= 2X X, soit une matrice definie posi- 

3 (33(3 T 

tive, e’est-a-dire que les determinants des sous-matrices de X T X soient 
tous positifs. 
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2. Proprietes de l'estimateur des MCO 

Dans le cas de la regression multiple, l’estimateur des MCO possede 
les memes proprietes que celles evoquees au chapitre 2 : i) l’estimateur 
des MCO du vecteur p est sans biais et efficient dans la classe des 
estimateurs lineaires. Cela se resume par le theoreme de Gauss- 
Markov: sous les hypotheses du modele classique lineaire general, 
l’estimateur des MCO P est l’estimateur BLUE 1 de beta. Par conse¬ 
quent, en supposant que les residus ei ~ IID(0, ct 2 ) et que X est non 
stochastique, on obtient le meilleur estimateur lineaire du modele de 
regression. 

II reste a demontrer ces proprietes. D’abord, celle ayant trait a 
l’absence de biais. On sait que [3 = (X T X) _1 X T y, ouy = Xp + e. En 
remplayant y par sa valeur dans 1’expression de J3 et en inserant 
l’esperance a 1’interieur de 1’expression, on a: E((3) = P + (X r X) _l 
X T E(e) puisque XIe. Par consequent, p ne presente pas de biais. 

Passons maintenant a la propriete de l’efficience. Rappelons le 
calcul de la variance de p. On a: V(j3) = E[(p - p)(p - P) T ] = X ' X) -1 
X 'Elee 'XX'X) -1 = ct 2 (X t X) _ 1 . A partir de ce resultat, on peut 
deduire que l’estimateur des MCO est l’estimateur lineaire dont la 
variance est la plus faible dans la classe des estimateurs lineaires. En 
effet, si 1’on suppose un autre estimateur lineaire P *, cela revient a 
dire que v|pj < v|p * j et que pour toute autre combinaison lineaire : 

v(c T p)<v(c T r). 

Envisageons maintenant l’estimateur de la variance de p, 

v(p) = a 2 (X T X) , ou a 2 = 6 6 , et ou a 2 est l’estimateur sans 
1 ’ T-k 

biais de ct 2 puisque le denominateur de a 2 represente le nombre de 
degres de liberte. 


1. Soit le best linear unbiaised. estimator. 
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R 2 et R 2 

Le coefficient de determination R 2 se calcule comme suit a partir de 
l’equation de SCT, soit la somme des carres totale: SCT = SCE + 
SCR, ou SCE designe la somme des carres expliquee et SCR, la 
somme des carres residuelle. En divisant les deux membres de 1’equa- 
tion par SCT, on obtient: 

R .,t-ggL =1 - E3 

SCT £(y,-y)’ y T Ay 

u T 

ou A = I-est la matrice de transformation des donnees en de- 

T 

viation de la moyenne. Par exemple, si R 2 = 87 %, cela signifie que 
87 % de la variation de la variable expliquee est attribuable aux varia¬ 
tions des variables explicatives. II peut etre montre que: 


R 2 ( Cov (y..y.) 1 

l/rtyT/vwJ’ 


qui est le coefficient de correlation au 


carre entre y t et y t . Comme y t est une prevision de la valeur de y t , R 2 
est un indicateur du caractere explicatif de l’equation de regression a 
bien modeliser y t . La valeur de R 2 est comprise entre 0 et 1. Plus R 2 
est rapproche de 1, plus le caractere explicatif du modele est impor¬ 
tant. Comme cela a ete explique au chapitre 2, cette mesure a la 
deficience d’augmenter au fur et a mesure que 1’on ajoute des variables 
explicatives meme si celles-ci ne sont pas significatives. A noter que 
1’interpretation du R 2 comme coefficient de correlation de Pearson 
entre une variable explicative et la variable dependante n’est plus 
valable, puisque Ton est evidemment ici en presence de plusieurs 
variables explicatives. Une mesure alternative qui corrige ce probleme 
associe aux degres de liberte est le R 2 ajuste de Theil. Elle se definit 
comme suit: 


R 2 =1- I°L(T-k) 

Kn-y) '(T-i) 
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Cette mesure utilise les estimateurs sans biais de la variance des 
erreurs residuelles et de la variance de y. II faut egalement souligner 
que les deux mesures du degre d’ajustement du modele de regression 
que nous avons presentees sont centrees, c’est-a-dire qu’elles sont 
definies en deviation de la moyenne. On pourrait egalement exprimer 
ces mesures en donnees brutes. 


3. Hypotheses sur les erreurs et consequences 

Supposons le modele de regression suivant: 

y t = Pi + (^ 2 x t 2 + ••• + Pk x tk + e t > t = 1, T 

ou e t ~ N(0, ct 2 ). L’application des moindres carres ordinaires (MCO) 
a ce modele implique que P ~ N^(3, a 2 (x T xj j. Precisons les impli¬ 
cations de ces hypotheses: 

i) Sous l’hypothese de normalite des erreurs, non seulement 
l’estimateur des MCO est BLUE par le theoreme Gauss- 
Markov, mais il devient le meilleur estimateur sans biais de 
p. La variance des MCO atteint la borne Cramer-Rao, borne 
inferieure pour tous les estimateurs. Cela signifie que sans 
l’hypothese de normalite, il peut exister un estimateur non 
lineaire biaise de (3, mais qui comporte une variance echan- 
tillonnale inferieure a celle des MCO. 

ii) L’estimateur des MCO de (3 se confond avec celui du maxi¬ 
mum de vraisemblance. Pour ce qui concerne la variance, 
l’estimateur de la variance de a 2 du maximum de vraisem¬ 
blance est toutefois biaise, ce qui n’est pas le cas pour les 
MCO. 

iii) Sous l’hypothese de normalite, on obtient des tests exacts. 
Sachant que (3 ~ N^(3,a 2 (x 1 xj j, cela revient a dire que 
l’on connait les distributions exactes des tests. On peut done 
construire les tests t, de \ 2 et de Fisher dans les petits echan- 
tillons. Advenant le cas ou l’on ne connait pas la distribution 
des erreurs, on recourt aux distributions asymptotiques de 
nos estimateurs pour ainsi effectuer les tests LM, LR et de 
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Wald. II existe d’autres methodes de tests pour les petits 
echantillons, tels les tests non parametriques. 


4. Tests d'hypotheses 

ET INTERVALLES DE CONFIANCE 

Tel qu’on vient de le mentionner, l’hypothese de la normalite des 
residus nous permet d’effectuer des tests d’inference et de calculer des 
intervalles de confiance. 


Tests t 

Considerons le cas ou ct 2 est inconnu. Soit HO : Pt = 0 et HI: Pt * 0, 
c’est-a-dire que l’on veut tester si (T est significativement different 
de 0. Pour construire ce test, on precede de la meme fagon qu’au 
chapitre 2, c’est-a-dire, sous HO: 

-y v((3 k ) 

ou Ckkprovient de la diagonale de la matrice (X T X)T La representa¬ 
tion matricielle de la variance de p est la suivante: 


T E X t2 • • • ^ x tk 

E X t2 E X t2 • • ‘ 'E X t2 X tk 



v E x * E x t2 x tk E x tk , 
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Par exemple, pour k = 2 , C22 est egal a: c 22 = ^x 2 2 . 


Intervalles de confiance 

Pour a 2 inconnu, la technique pour construire un intervalle de con- 
fiance est exactement la meme que celle presentee aux chapitres 1 et 
2, c’est-a-dire: 

P[-t c <t<t c ] = l-a 

=> p[h - t'Jv(h ) < Pk < Pk + t c jv(p k )] =1 - a 

L’intervalle de confiance pour (3 k s’ecrit: [3 k ±se(j3 k )xt c , ou se est 
l’ecart-type de (3 k . Le test qui vient d’etre presente est bilateral. Pour 
ce qui conceme les tests unilateraux, la technique est identique a celle 
exposee aux chapitres 1 et 2. 

Test F 

Dans le chapitre precedent, on a presente le test F dans le cas univarie 
comme etant un t 2 . Mais dans sa forme la plus classique, le test F est 
utilise pour effectuer un test conjoint sur l’ensemble des parametres. 
En effet, pour tester 1’hypothese HO: ^2 = P3 = ••• = Pk = 0: p s = 0 
contre HI: au moins l’un des Pk est different de 0: p s * 0. Le test F 
correspondant est le suivant. Tout d’abord, nous savons que: 
P s ~N^P s ,a 2 Mj. Posons: 

w,=(P.-|3.) T [v(P.)[ I (P.-|3.) 

= (P,-|5,) T ^]-(|5,-P,)~*c ! ( k -l) 


ou M = (x 2 T AX 2 ) 1 =(x* r x*y\ Posons: 
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a ; (T-k) 


-Xc 2 (T-k) 


Sachant que le test F est construit a partir du ratio de deux x 2 divisees 
par leurs degres de liberte respectifs, on a alors: 




(k-1) 

(T-k) 


k-1 


d ! (T-k) 


(Ps - ) T (Mo 2 ) ' (|B S - ) 


k-1 

S -Ps) T (v(P s ) 


"(p.-p.) 


F c (k-1, T-k) 


Etant donne que l’on teste HO: p s = 0, on peut ecrire: 


Ps T | 

F =- 


v "' 11 '■ 

k-1 


~ F c (k -1,T - k) 


Comme F = 





(T-K) 


SCE 

—— et que 


g 2 (T ~ k) _ SCR 
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F _ SCE/k-1 _ R 2 /k-1 
SCR/T-k(l-R 2 )/T-k 

puisque R 2 x SCT = SCE et (l - R 2 j x SCT = SCR. 


Estimation en presence de contraintes lineaires 
sur les parametres 


Dans la section precedente, nous avons presente la procedure gene- 
rale pour tester l’ensemble des parametres. Dans cette section, nous 
nous attaquons a la procedure pour tester un sous-ensemble de para¬ 
metres faisant partie de cet ensemble. A cet effet, supposons que 1’on 


veut tester HO: P s 


V 


'o' 

J*3, 


v°y 


qui est le sous-ensemble de l’ensemble 


des parametres (02, 03,.--, 0k), contre l’altemative HI: 



V 


V 

Ps = 


* 



J* 3 , 


v°y 


. En utilisant la notation habituelle, on peut ecrire les 
contraintes lineaires sur les 0 comme suit: 


R0 = r 

Le test HO est ici le suivant si Ton suppose un ensemble de cinq 
parametres: 

HO: R0 = r 
HI: R0*r 

oil: 
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■pr 





p 2 




o 

o 

o 

o 



v 

RP = 

0 0 10 0 

Pb 

_ 

.Pb. 


P 4 


Lp 5 J 


Pour construire le test F en utilisant cette notation, il faut estimer la 
covariance de j3 s , c’est-a-dire: 


v(p s ) = Rv(p)R T =Ra 2 (x T x) _ 1 R T 


v(pi) C6 v(Pj,P 2 ) 
CSv(Mi) v(p 2 ) 


'o 1 0 0 o' 
^0 0 1 0 0 , 


Cov(p l ,p s )'' 

Cov(p 2 ,p s ) 


(0 


o' 

0 


0 1 

0 0 


Cov(Ml) C6v(p s ,p 2 ) . 

V(pa) C6v(p 2> p 3 )“ 

Cov(p 2 ,p 3 ) V(p 3 ) 


1° 0. 


Apres avoir calcule cette variance et sachant que R(3 = |3 S et que 
RP - r = |p s -P s j,on peut ecrire le test F base sur la notation gene- 
rale des contraintes lineaires sur les parametres comme suit: 
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(RP ~ r ) T [RCov(p)R T ] _1 (RP - r) 

q 

(RP-r) T [R(x T x)' 1 R T ] '(Rp-r) 
qa 1 

SCR r -SCRu 

T-k 


Envisageons maintenant 1’estimation en presence de contraintes. 
Nous traitons toujours le cas du modele de regression lineaire a cinq 
parametres ou HO : p 2 = P 3 = 0. Si l’on incorpore ces contrainte, dans 
ce modele, on a: 


Yt =Pi+p4 x 4t+p5 x 5t+eRt 

En appliquant les MCO sur cette equation, on obtient les residus 
suivants: 


e R 


-y- x Rp R 
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La somme des carres residuels contraints est done egale a: 

SCR E =(y-XP E ) T (y-XP R ) = 6 E T e R 
Par ailleurs la somme des carres residuels non contraints, soit SCRu, 
est egale a: SCRu = (y - XPu) (y - X|3u ) = eu^u- Par conse- 



'P 2 ' 


'o’ 


‘o’ 

quent, le test d’hypothese HO: (3 S = 

J*3_ 


0 

contre HI : (3 S ^ 

0 


SCR r -SCRu 

s’ecrit comme suit: F =--F c (2,T-k). Si HO est 

T-k 

vraie, on devrait s’attendre a ce que SCRr soit tres rapproche de 
SCRu- En effet, les variables 2 et 3 n’exercent pas alors d’incidence 
sur la regression. La statistique F est alors rapprochee de 0, tres en 
dega du seuil critique au-dela duquel HO serait rejetee. Par ailleurs, si 
F > F c , SCRu est sensiblement plus faible que SCRr et les contraintes 
ne sont pas valables. HO est alors rejete 2 . 

Supposons maintenant que l’on veut estimer et tester le modele 
contraint suivant. Dans le modele precedent, nous imposons les con¬ 
traintes suivantes. Sous 

HO: 02 + 03 + 04 + 05 + 0 


2. La variance de l’estimateur contraint sera toujours inferieure ou egale a cede de 
l’estimateur non contraint puisque, a 1’instar de la statistique bayesienne, on fait 
appel a de l'information supplementaire a l’exterieur de 1’echantillon. 
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C’est-a-dire, en notation matricielle: 


RP = r, ou 


RP = [0 


'P,' 

P 2 

i 1 ] p 3 =o+p 2 + p 3 +p 4 +p 5 


P 4 

.P, 


et r = 0. Par ailleurs, sous HI: Rp r. L’interpretation de HO est la 
suivante. Imaginons que le modele precedent concerne la demande 
d’un bien, par exemple la demande de contrats au comptant sur les 
carcasses de pore, sur lesquelles peuvent etre aussi ecrits des contrats 
a terme. Les variables explicatives x 2 , X 3 et X 4 sont les prix relatifs 
habituels et X 5 est le revenu. Supposons que l’on double le prix des 
carcasses (x 2 ), de meme que les prix des autres viandes (X 3 )et les prix 
des biens et services restants (X 4 ). On double egalement le niveau du 
revenu (X 5 ). Dans ce contexte, l’hypothese HO signifie que la quantite 
demandee de carcasses de pore demeurerait la meme en depit de ces 
variations de prix et de revenu. 

Pour tester HO, on estime l’equation restreinte suivante. Rem- 
plagons P 4 par - P 2 - P 3 - P 5. 3 En substituant cette valeur dans Pequa- 
tion presentee precedemment, nous obtenons le modele contraint 
suivant: 

y t = Pi + p 2 x 2t + P 3 x 3t + (-P 2 - p 3 - P 5 )x 4t + P 5 x 5t + e Rt 
En rearrangeant cette equation, on obtient: 

Yt =Pl+P2( x 2t- x 4t) + p3( x 3t- x 4t) + p5( x 5t- x 4t) + e Rt 

3. Ce qui est bien sur une fagon d’exprimer l’hypothese HO : P2 + P3 + P4 + Ps = 0. 
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Dans une premiere etape, on estime ce modele par les MCO pour 
obtenir les residus contraints e R et 1 ’on peut ainsi calculer la somme 
des carres residuels contraints: SCR r = e R 1 e R . Dans une deuxieme 
etape, on estime le modele non contraint d’ou l’on deduit la somme 
des carres residuels non contraints: SCR v = e L , e L ,. A l’aide de ces 
informations, on formule le test F comme suit: 

(SCR r -SCRu)/1 t , 

F = --^-—-F (l,(T - 

SCRu /(T -5) V 

ou q = 1 et k = 5. La regie est de rejeter HO si F > F c (1, (T - 5)) ou si 
la p-value(F) < 0,05. Notons que pour J = 1, un test de Student aurait 
pu convenir. En effet, l’hypothese HO se formule alors comme suit: 

HO: p 2 + P 3 + P 4 + P 5 = 0 

contre 1’alternative HI : (3 2 + (L + (L + Ps ^ 0. La procedure du test 
s’effectue en deux temps. 

1) On estime la regression: y t = Pi + fi 2 x 2t + fLx 3 t + (^ 4 X 4 ,- + P 5 X 5t 
par les MCO, d’ou on obtient P 21 P 31 P 4 et Ps- 

2) On fait la somme de ces coefficients estimes et on construit 
le test t de Student de la fagon habituelle. 

(p 2 +P3 +P4 + M -0 , , 

t= V ^ ’ ~t c (T-5) 

^v(p 2 +p 3 +p 4 +p 5 ) 

ou V se calcule comme suit: 

v(p, + p, + p 4 + p 5 ) = £ v(p,) ■+ £ t‘ C ° V (P‘ ,Pi ) 

x=2 i=2 j=3 

et ou CovIPjjPj j provient de la matrice variance-covariance de (3: 
P: v|p j = a 2 ^X T Xj . La regie est de rejeter HO au seuil a = 5 % si 
|t|>t c (T-k),ou lorsque la p-value(t) < 5 %. 
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II est a signaler que le test F aurait pu etre formule en termes de 
R 2 . Le test F pour tester un sous-ensemble de parametres s’exprime 
comme suit: 


F _ (SCR R -SCR u )/q _ (R 2 u-R 2 R )/q 
SCRu/(T-k) ~~ (l _ Ru)/(T-k) 
Cette derniere egalite repose sur les relations suivantes: 
SCR r = (l - R 2 r )SCT R ; SCRu = (l - R 2 u ) SCT V 


5. Prevision dans le modele lineaire general 

Nous transposons ici les techniques de prevision introduites au cha- 
pitre 2 au modele lineaire general. Soit le modele suivant a quatre 
variables explicatives: 

y t = Pi + p 2 x t 2 + P 3 x t3 + p4 x t4 + ^5 x t5 + 
ou e t ~ N(0, ct 2 ). Supposons que l’on veuille predire y a partir des 
valeurs suivantes des variables explicatives: xo = [1 X 02 X 03 X 04 xo 5 ] T . On 
veut done predire E(yo). En substituant le vecteur xo dans l’equation 
de y t , on obtient: 

yo = x o T P + e o 

ou p = [P 2 P 3 P 4 P 5 ] T - Le meilleur estimateur lineaire sans biais de 
E(y 0 ) est: 

y 0 = x o T P 

ou p est l’estimateur de la regression de y t sur le terme constant et ses 
quatre variables explicatives. L’intervalle de confiance de cet estimateur 
est: 


yo±t a , 
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6. Applications 


Pour illustrer ce chapitre, nous renouons avec 1’exemple des depenses 
sur les cartes de credit que nous avons traite en partie dans les cha- 
pitres precedents. Nous voulons effectuer la regression suivante, qui 
renferme plusieurs variables explicatives: 

y = *iPi +x 2 p 2 +X3P3 + x 4 p 4 +x 5 p 5 +e 
ou xi est un vecteur unitaire; X 2 est le vecteur des donnees sur les 
revenus; X 3 , le vecteur des revenus au carre qui sert a capter la non- 
linearite de la fonction des depenses; X 4 , un vecteur des ages en 
annees; X 5 , un vecteur de variables dichotomiques qui prend la valeur 
1 si 1’individu possede une maison et 0 s’il est a loyer. En appliquant 
les MCO sur ces donnees, on obtient les resultats qui apparaissent au 
tableau 3.1. 

Tableau 3.1 


Dependent Variable: CARTE 
Method: Least Squares 
Date: 04/13/00 Time: 18:09 
Sample :1 100 IF X3 >0 
Included observations: 72 


Variable 

Coefficient 

Std. Error 

t-Statistic 

Prob. 

C 

-237.1465 

199.3517 

-1.189589 

0.2384 

REVENU 

234.3470 

80.36595 

2.915999 

0.0048 

REVENU A 2 

-14.99684 

7.469337 

-2.007788 

0.0487 

AGE 

-3.081814 

5.514717 

-0.558835 

0.5781 

LOYERMAISON 

27.94091 

82.92232 

0.336953 

0.7372 

R-squared 

0.243578 

Mean dependent var 

262.5321 

Ajusted R-squared 

0.198418 

S.D. dependent var 

318.0468 

S.E. of regression 

284.7508 

Akaike info criterion 

14.20802 

Sum squared resid 

5432562. 

Schwarz criterion 

14.36612 

Log likelihood 

-506.4888 

F-statistic 


5.393722 

Durbin-Watson stat 

1.682310 

Prob(F-statistic) 

0.000795 


smpl if x3 = 0 
series carte = na 
series loyermaison = na 


series revenu = na 


smpl if x3 > 0 
series carte = x3 
series loyermaison = x4 

series revenu = x2 
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On observe entre autres que seules les variables revenus et revenus 
au carre sont significatives au seuil de 5 % puisque leur p-value est 
respectivement de 0,005 et de 0,049, soit inferieures au seuil critique 
de 0,05. Les R 2 et R 2 ajuste sont respectivement sont de 24,3 % et de 
19,8%, soit du meme ordre que dans 1’exemple du chapitre 2. En 
regard de cet exemple, l’augmentation du R 2 ajuste est faible puisque 
dans cet exemple, celui-ci se situait a 18,5 %. Par ailleurs, le R 2 ordi¬ 
naire a beaucoup plus augmente puisque dans 1’exemple du chapitre 2 
il se situait a 19,6%. Cette situation etait anticipee puisque le R 2 
ordinaire n’est pas corrige pour les degres de liberte. 

Finalement, le test F sur l’ensemble des variables explicatives 
degage une statistique F de 5,39 et sa p-value est de 0,000. Les 
variables explicatives sont done significatives et tel que mentionne 
plus haut, les tests t nous permettent de discriminer entre les variables 
explicatives. 
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ANNEXE 


RAPPELS DE CALCUL MATRICIEL 


1. Operations matricielles 

1.1. Addition et soustraction 

Soit deux matrices carrees A et B d’ordre 2 X 2. La somme de ces 
deux matrices s’effectue comme suit: 


A + B 


a n a i 2 b u b 12 


_ a 21 a 22 _| L^21 


b 22 . 


+ bn 

a i2 +b] 

+ b 2i 

a 22 +b; 


Pour la soustraction des deux matrices A et B, on remplace les + par 
des - au niveau des elements de la matrice B. 

Soit trois matrices A, B et C conformables. La loi de l’associativite 
vaut egalement pour la somme des matrices, c’est-a-dire: 

(a+b)+c = a+(b+c) 
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1.2. Multiplication et produit Kronecker 


Nous voulons maintenant multiplier les matrices A et B. Ces deux 
matrices sont conformables pour la multiplication puisque le nombre 
de lignes de A est egal au nombre de colonnes de B. Nous procedons 
comme suit pour multiplier A et B : 


a nbn +a 12 b 2 i a nbi 2 +a 12 b 22 
a 2 ibn+a 22 b 21 a 21 b 12 +a 22 b 22 


Par ailleurs, A®B, ou le produit Kronecker de A et B, designe le 
produit de chaque element de A par B, c’est-a-dire: 


n B a 12 B 
21 B a 22 B 


Soit trois matrices conformables A, B et C. La loi de l’associativite 
vaut pour le produit de ces trois matrices : 

(ab)c = a(bc) 


1.3. Transposee d'une matrice 

Soit la matrice precedente A. Sa transposee est l’interversion de ses 
lignes et colonnes, c’est-a-dire: 


A t 


21 


_ a 12 a 22 


Soit trois matrices conformables A, B et C. On a: 

(a+b+c) t = a t +b t +c t 
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Par ailleurs, la regie concemant la transposee d’une multiplication est 
la suivante: 


(abc) t =c t b t a t 

2. Matrices carrees importantes 

2.1. La matrice I 

La matrice identite de dimension (n X n) s’ecrit comme suit: 


1 0 ... O' 
0 10 . . 0 


I n = 


0 0 0 


Cette matrice est diagonale car les triangles superieurs et inferieurs 
contiennent des elements qui sont mils. Seuls les elements de la 
diagonale principale ne sont pas mils. Supposons maintenant un vec- 
teur y de dimension (n X 1). On a: I n y = y. La transposee de cette 
operation est la suivante: (l n y) = y T I J = y T . 

La matrice I n est un cas de matrice symetrique. En effet, une 
matrice symetrique est une matrice carree, c’est-a-dire de dimension 
(n X n), qui est egale a sa transposee. Soit une matrice carree A. A est 
symetrique si: A T = A. Pour fixer les idees, dans le cas de la methode 
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des MCO, la matrice (X T X) est une matrice symetrique puisque la 
transposee de cette matrice est egale au resultat initial. 

2.2. Matrice idempotente 

La matrice A est idempotente si A = A 2 = ... = A n . C’est-a-dire que 
lorsque 1’on multiplie la matrice A par elle-meme autant de fois que 
l’on veut, on revient a la matrice originale. Une matrice idempotente 
tres connue est la matrice dite residuals maker matrix * que 1’on peut 
traduire en franyais par matrice generatrice des residus : 

M = I-X(X t X)- 1 X t 

Cette propriete signifie, par exemple, que M 2 = M. Cette matrice a 
egalement la propriete d’etre symetrique, c’est-a-dire que: M T = M. 

A ce stade-ci, il convient d’introduire la trace d’une matrice 
carree. Elle se definit comme la somme des elements de sa diagonale 

principale, c’est-a-dire: tr(A) = ^a^ , ou A est une matrice carree. 

Soit maintenant deux matrices A et B, dont les dimensions respectives 
sont de (m X n) et de (n X m). Par consequent, AB et BA sont deux 
matrices carrees et: 


tr(AB) = tr(BA) 

Pour trois matrices A, B et C, si le produit donne des matrices carrees, 
tr(ABC) = tr(CAB) = tr(BCA) 

e T e 

Cette propriete nous a servi a demontrer que a =- est un 

T-k 

estimateur non biaise de a 2 . En effet, pour demontrer cette propriete, 
il faut calculer 1’esperance de a 2 , et pour effectuer cette operation, on 
doit calculer E(e T e), c’est-a-dire: 


4. Cette matrice est ainsi appelee car lorsqu’elle premultiplie y, on obtient les residus 
estimes. En effet, My = [I - X(X T X)-' X T ] y = y - X T X)-'X T y = y - Xp = e. 
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E(e T e) = E(e T M T Me) 

= E(e T Me) 

= E(tr(e T Me)) 

car la trace d’un scalaire est egale a ce scalaire 5 . II s’ensuit que: 

= E(tr(Mee T )) 

= tr|ME^ee T )j 
= tr(Mc 2 I) 

= a 2 tr(Ml) 

= a 2 tr(M) 

Pour terminer ce calcul, il nous suffit de calculer la trace de la matrice 
M. Ce calcul s’effectue comme suit: 

tr (M) = tr(l) - tr^x(x T x) _1 X T j 

= n-tr((x T xf'x T x) = n-tr(l k ) = n-k 

2.3. Le determinant d'une matrice 

Soit une matrice B de dimension 3X3: 

t>n b 12 b 13 

B = b 21 b 22 b 23 

_b 3 i b 32 b 33 _ 

5. En effet, e T Me est un scalaire. 
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Le determinant de B se calcule comme suit: 

| B | = E ±b li b 2j b 3k 
i,j,k 

= b 11 b 2 2b 3 3 +b 12 b 23 b 31 +b 13 b 21 b 32 

— bnb 23 b 32 -b 12 b 21 b 33 -b 13 b 22 b 31 

L’operateur L± commande toutes les permutations des indices 1, 2 et 
3, le signe moins s’imposant lorsque l’ordre naturel des indices est 
inverse. De fagon plus generale, le determinant d’une matrice A est: 

| A |= J^±a li a 2j ...a ns 

Voici quelques proprietes des determinants : 

i) Le determinant d’une matrice triangulaire B 

~b n 0 0 ' 

B = b 21 b 22 0 

_b 3 i b 32 b 33 _ 

est egal au produit des elements de sa diagonale principale, 

soit sa trace: 

| B | = b u b 22 b 3 3 

ii) Le determinant du produit de deux matrices carrees A et B 
de meme dimension est egal a: 

|ab| = |a| |b| 

Un corollaire a cette regie est que: 
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iii) La multiplication de toute ligne ou colonne d’une matrice 
par une constante a le meme effet sur le determinant de cette 
matrice. Pour illustrer, multiplions par c la premiere ligne de 
la matrice B precedente: 


cb u cb i2 cb 13 

b 2 i b 22 b 23 

b 3i b 32 b 33 


Par ailleurs, multiplier tous les elements d’une matrice (n X n) 
par la constante c revient a multiplier son determinant par c n . 

iv) Si une ou plusieurs lignes ou colonnes d’une matrice sont 
lineairement dependantes, alors le determinant de cette 
matrice est nul. On dit qu’une telle matrice est singuliere par 
rapport a une matrice reguliere dont le determinant est 
different de 0. 


2.4. L'inverse d'une matrice 


L’inverse d’une matrice se calcule comme suit en utilisant la methode 
de 1’adjointe (adj). Soit une matrice B de dimension (3 X 3). Son 
inverse designe par B' 1 se calcule comme suit: 


B- 1 =—x(adj(B)) = —: 
|b| 1 n |B| 


Cn C 12 c 13 

C21 c 22 c 23 

c 3 i c 32 c 33 


Ci, =(-!)'” M, 
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Qj est appele le cofacteur et Mjj est le mineur, obtenu en calculant les 
determinants des sous-matrices obtenues en supprimant la i e ligne et la 
j e colonne. A titre d’exemple, pour la matrice B (3 X 3) precedente, 
Cn est egal a: 


c„=(-ir 


Voici les proprietes de l’inverse. 

i) L’inverse de l’inverse d’une matrice carree B donne la ma¬ 
trice B, c’est-a-dire: (B -1 ) -1 = B. 

ii) Le produit d’une matrice par son inverse donne la matrice 
unitaire : BB 1 = I. 

iii) L’inverse de la transposee d’une matrice est egale a la trans- 
posee de l’inverse: (B 1 ) -1 = (B _1 ) T . On a done: (B _1 ) T B T = I. 

iv) L’inverse d’une matrice triangulaire superieure ou inferieure 
est egalement une matrice triangulaire superieure ou infe¬ 
rieure. 


v) 


L’inverse d’une matrice partitionnee est egalement une ma¬ 
trice partitionnee. Soit la partition suivante de A: 

An A 12 


A = 


ou An et A 2 2 sont des matrices carrees 


>21 A 22 J 

regulieres. L’inverse de cette matrice est alors: 


—Bn Ai 2 A 22 


-A22A21B11 A 22 + A 22 A 2 iBnAi 2 A 22 


An +AnA 12 B 22 A 2 iAr 1 -Ar>i 2 B 2; 

-B22A21A1-1 1 B 22 
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°u: B n - (A n - A 12 A 2 2 A 21 j etB 22 -(A 22 A^A^A^j . 

Pour illustrer, prenons l’exemple suivant. Dans le cas du 
maximum de vraisemblance d’une regression lineaire a plu- 
sieurs variables explicatives, la matrice d’information 6 , qui 
sert a calculer la matrice variance-covariance des estimateurs 


de p et de ct 2 , est la suivante: I 


Pi 


0 

„ 2 a 4 


Cette matrice partitionnee est de la forme: 


An 0 
0 A„ 


En vertu de la formule de 1’inverse de la matrice partitionnee 
qui vient d’etre exposee, l’inverse d’une telle matrice est la 


a,; 1 o 


r 1 




0 a 22 

p ^ 


0 2 (x r xy 1 0 


- 

n 

v a 2 j 


0 — r 



v 2a 4 ) 


I 1 (.) est done egale a 


Cette matrice est parti- 


culierement utile pour le calcul des tests asymptotiques de 
Wald et LM ou elle apparait explicitement. 


6. Cette matrice est ainsi appelee car elle informe sur la courbure de la fonction de 
vraisemblance. 
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3. Des matrices importantes : 

LA MATRICE VARIANCE-COVARIANCE 

D'UN PORTEFEUILLE DE TITRES ET LA COVARIANCE 

ENTRE DEUX PORTEFEUILLES 

Imaginons qu’un portefeuille soit compose de deux litres : le titre 1 et 
le titre 2. La ponderation du titre 1 dans ce portefeuille est wi et celle 
du titre 2, W 2 - De plus: wi + W 2 = 1. L’esperance du rendement de ce 
portefeuille est de: 

E( R p) = w,E(R,) + w 2 E(R 2 ) 

Par ailleurs, la variance du rendement du portefeuille est pour sa part: 

Var( Rp ) = E[R p -E(R p )f 

En remplagant R p et E(R p ) par leur valeur respective, on a: 

Var(R p ) = E[w 1 R 1 +w 2 R 2 -w 1 E(R 1 )-w 2 E(R ! )] 2 
En regroupant les termes, on obtient: 

Var(R p ) = E[w,(R, -E(R,)) + w 2 (R 2 - E(R 2 ))f 

= wf[R, -E(R,)] 2 +2w,w 2 e[(R, -E(R,))(R 2 -E(R 2 ))] 

+w'[r,-e(r 2 )] ; 

= w 2 t o 2 1 +2w 1 w ! o u +w]o 2 2 

ou Oj designe la variance du rendement du titre 1; a la variance du 
rendement du titre 2 et <ri 2 , la covariance entre les rendements des 
titres 1 et 2. Plus generalement, dans le cas d’un portefeuille de N 
titres, la variance du rendement de ce portefeuille s’ecrit: 

Var ( R p)=L 
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L’equation de la variance du rendement d’un portefeuille est une 
forme quadratique. On peut recourir a la forme matricielle quadra- 
tique pour 1’exprimer de fagon plus compacte et combien plus facile a 
manipuler. 

Dans le cas de deux titres, l’esperance du rendement du porte¬ 
feuille anterieur s’ecrit: 


e K)= 


E(R,)' 

E( r 2 )_ 


w t E 


ou E est le vecteur des esperances de rendement. La variance de R p est 
de: 


Var(R p ) = [w, 



w T Xlw 


ou D, designe la matrice variance-covariance des rendements des deux 
titres. La variance du rendement d’un portefeuille est done une forme 
quadratique matricielle. Certes, cette matrice est symetrique puisque 
u 12 = cr 21 - Le lecteur generalisera tres facilement les resultats ante- 
rieurs au cas de N titres. 

Nous envisageons maintenant deux portefeuilles qui renferment 
les titres 1 et 2, mais avec des pond era tions differentes. Dans le 
premier, que nous designons par p, les ponderations des deux titres 
sont de wi et W 2 - Dans le second, que nous designons par s, les pon¬ 
derations sont de zi et Z2. Certes, pour chacun de ces deux porte¬ 
feuilles, la somme des ponderations est egale a 1. 

Nous voulons calculer la covariance entre les rendements des 
portefeuilles p et s. Cette covariance en vertu meme de la definition 
de la covariance, est egale a: 

Cov(r p ,r s )=e[(r p -e(r p ))(r s -e(r,))] 
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En remplagant R p et R s par leur equivalent en termes des rendements 
des titres 1 et 2, on obtient: 

’(wjRj + w 2 R 2 - w^Rj) - w 2 E(R 2 
(zjRj + z 2 R 2 - ZjE^Rj) - z 2 E(R 2 )j 

En regroupant les termes, on a: 


Cov(R p ,R s ) = E 


Cov(R p ,R s ) = E< 


[w,(R, -E(R,)) + w 2 (R 2 -E(R,))] 
Jz,(R 1 -E(R 1 )) + z i (R ! -E(R 1 ))] 


= w 1 z 1 E[R 1 -E(R 1 )] 2 

+w 1 *,[(r ! -e(r ! ))(r 1 -e(r,))] 

+ w 1 2 j [(R 1 -E(R,))(R ! -E(R,))] 
+ w 2 z 2 [R, -E(Rj)] 2 


On obtient finalement: 

Cov(R p ,R s ) = WjZjOj + w 2 ZjC 21 + w l z 2 c l2 + w 2 z 2 a 2 

Cette expression finale de la covariance entre les rendements de deux 
portefeuilles est deja lourde et pourtant les portefeuilles ne compren- 
nent que deux titres. Le recours au calcul matriciel simplifie de beau- 
coup le calcul de cette covariance. Pour le cas precedent, on a: 


Cov(R p ,R s ) = [w, 



ou w designe le vecteur de ponderations du portefeuille p et z, celui du 
portefeuille s. Cette expression se transpose immediatement au cas de 
N titres. 
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4. QUELQUES APPLICATIONS DU CALCUL MATRICIEL 
EN FINANCE 

Dans le but d’illustrer l’utilisation du calcul matriciel en finance, nous 
presentons dans cette section trois applications : i) la couverture opti- 
male d’un bilan bancaire par des contrats a terme; 2 ) la construction 
de la frontiere efficiente; 3) le modele de l’erreur de suivi (tracking 
error ) de Roll. 


4.1. Couverture optimale d'un bilan bancaire 4 

Le modele que nous presentons dans cette section est une simple 
transposition de la theorie du portefeuille de Markowitz au bilan 
bancaire. En effet, un bilan peut etre considere comme un portefeuille 
de titres. Les actifs sont assimilables a des titres que detient un inves- 
tisseur, ici une banque. Pour leur part, les passifs peuvent etre consi¬ 
ders comme des actifs negatifs, soit des titres vendus a decouvert 
dans le cadre de notre analogic. L’objectif de la banque est de maxi¬ 
miser le rendement de l’avoir des actionnaires. Le bilan de la banque 
se presente comme suit: 


Bilan de la banque XYZ 


Actifs 

Passifs 

Vj 

v 3 

v 2 

v 4 


s 


ou Vi designe les actifs a court terme; V 2 , les actifs a long terme; V 3 , 
les passifs a court terme; V 4 , les passifs a long terme et S, Pequite. 
L’avoir des actionnaires peut pour sa part, etre considere comme un 
investissement dans un portefeuille qui est en compte {long) dans les 
actifs et a decouvert {short) dans les passifs. 


4. Pour rediger cette sous-section, nous nous inspirons de: Copeland, T.E. et 
J.F. Weston (1988), Financial Theory and Corporate Policy, Addison Wesley, New 
York, chap. 6. 
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Chacune des rubriques du bilan, actif et passif, comporte un taux 
de rendement R; et un coefficient de ponderation wi. Ces coeffi¬ 
cients sont definis par rapport a l’avoir des actionnaires: 


V; 

s 


ou Vi designe la valeur de l’actif (ou du passif) et S, l’equite. La somme 
de ces coefficients de ponderation est bien sur egale a l’unite en vertu 
de l’identite comptable du bilan. 

Le rendement de l’avoir des actionnaires s’ecrit comme suit: 


R s = WjRj +w 2 R 2 +W 3 R 3 + W 4 R 4 


ou W 3 et W 4 , associes a des passifs, sont negatifs. 

La banque veut minimiser la variance de 1’avoir de ses action¬ 
naires. Pour ce faire, elle recourt a des contrats a terme. Le prix d’un 
contrat a terme est de P 5 et son rendement, de R 5 .. On veut deter¬ 
miner le nombre de contrats a terme, designe par N, qui minimise la 
variance du rendement des actionnaires. 

Les contrats a terme, selon qu’ils soient achetes ou vendus, 
deviennent un nouvel actif ou passif dans le portefeuille que constitue 
le bilan bancaire. A la suite de l’introduction des contrats a terme, le 
rendement de l’avoir des actionnaires s’ecrit: 



Pour trouver le nombre de contrats qui minimise la variance de 
R s , on egale la derivee de la variance de R s par rapport a N a 0. La 
variance de R s est egale a: 


Var(R s ) = w T ftw 



soit la transposee des coefficients de ponderations et ft est la matrice 
variance-covariance des rendements de tous les actifs et passifs pre¬ 
sents dans le bilan de la banque, y compris les contrats a terme, c’est- 
a-dire: 
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,°51 °52 ■ • - a 55 


Nous tirons parti des regies de la derivation matricielle pour 
calculer N. Rappelons rapidement l’une d’elles que nous utilisons a 
Pinterieur de cet exercice. La variance de R s est une forme matricielle 
quadratique du type: 

y = x t Ax 

ou A est une matrice (N x N) et x, un vecteur (Nxl). La derivee de 
y par rapport a x est egale a: 


dy 

dx 


= 2Ax 


Dans le cas ou A est une matrice (2x2), cette derivee est egale a: 


dy 


2 a n x i +2a 12 x 2 

dxj 


dy 


2 a 21 Xj +2a 22 x 2 



dx 2 



Dans le cas qui nous interesse, si l’on derive la variance de R s par 
rapport a w, on obtient: 

dVar(R ) 

-= 2ilw 

dw 
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Pour le cinquieme actif, soit le contrat a terme, cette derivee est egale a: 
dVar(R ) ^ 

-— = zil 5 w = 2 o 51 w j +za 52 w 2 + ... + 2 o 55 w 5 


ou w 5 =- et O 5 designe la 5 e ligne de la matrice V. 

- Revenons au probleme qui nous interesse. On veut determiner le 
N qui minimise la variance de R s . Pour ce faire, on recourt a la 
regie de la chaine: 

dVar(R s )_dVar(R s )dw 5 


dN 


dwc 


dN 


- = 0 


P, 

2 HrW X— = 0 

S 

Puisque (P 5 /S) ne peut etre nul, cette egalite implique que: 
21X 5 w = 0 

Et comme: 

_ V; 
w i- S 

cette condition d’optimisation s’ecrit, en termes de V: 

21X S V = 0 

En isolant la valeur du cinquieme actif, soit celle du contrat a terme 
qui est egale a NP 5 , on obtient: 

ofNP, =-£v l<% 

La valeur de N qui minimise la variance de 1’avoir des actionnaires est 
done egale a: 

^P 5 g 5 2 

On est done a meme de constater que ce sont les covariances entre le 
rendement du contrat a terme et celles des autres actifs et passifs du 
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bilan qui importent du point de vue de la couverture. A l’instar de la 
theorie de Markowitz, les covariances des rendements tiennent le haut 
du pave comme mesure du risque dans ce modele de couverture 
optimale d’un bilan. 

II est plus simple de manipuler cette derniere formule lorsqu’elle 
est exprimee en termes de correlation des rendements. La relation 
entre la covariance 015 et la correlation ns s’ecrit bien sur comme suit: 


a i5 = r i 5 a ; a 5 

En termes de correlation, le nombre optimal de contrats a terme 
requis pour la couverture du bilan est egal a: 


N = -I 


V; 


cv 

— xr i5 

°5 


Cette formule nous indique que la couverture optimale d’un bilan par 
des contrats a terme depend de trois facteurs: 

i) le ratio de la valeur de la rubrique du bilan a couvrir au prix 
d’un contrat a terme: —. En fait ce facteur est associe a une 

P 5 

couverture naive. Celui qui est etranger a la finance divise la 
valeur a couvrir par le prix d’un contrat pour determiner le 
nombre de contrats optimal. Mais la formule signale que ce 
dilettante oublie deux elements dont tout bon specialiste de 
la finance doit tenir compte: 

ii) le rapport entre la volatility de l’actif a couvrir et celle du 

contrat a terme: —. En effet, plus la volatility de l’actif (ou 
° 5 

du passif) a couvrir est elevee par rapport a celle du contrat 
a terme, plus il faut acheter de contrats. On exerce alors un 
effet de levier sur la volatility du contrat a terme, ce qui la 
rapproche de celle de 1 ’actif (ou du passif) a couvrir; 

iii) la correlation entre le contrat et l’actif a couvrir: r^. S’il 
n’existe aucune correlation entre le rendement du contrat a 
terme et celui d’un actif (ou d’un passif), inutile de couvrir 
cet actif (ou ce passif). Par ailleurs, si la correlation est de -1, 
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cela correspond a la situation ideale au plan de la couverture. 
S’il appert que cette correlation est de -1 pour chaque 
rubrique du bilan, la variance de R s s’averera nulle apres 
couverture, c’est-a-dire que la variance minimale de 1’avoir 
des actionnaires est alors nulle. 

La formule de la couverture optimale nous revele d’autres infor¬ 
mations. Considerons d’abord le cas d’un actif. Le V correspondant 
est alors positif dans la formule. Si la correlation entre le rendement 
du contrat a terme et celui de cet actif s’avere positive, la formule 
indique qu’il faut alors vendre des contrats a terme pour les fins de la 
couverture (N negatif) puisque la formule est precedee d’un signe 
negatif. Dans pareil cas, les prix de 1’actif et du contrat a terme ont 
tendance a evoluer dans la meme direction. De fagon a couvrir 1’actif 
par le contrat a terme de maniere a diminuer sa volatilite, il faut done 
inverser cette correlation entre les prix de 1’actif et ceux du contrat a 
terme. C’est en vendant des contrats a terme qu’on pourra y parvenir. 
Les pertes que l’on essuiera sur 1’actif seront alors compensees par les 
gains realises sur la vente de contrats a terme, ce qui est le principe 
meme de la couverture {hedging). 

Supposons maintenant un cas de correlation positive entre le ren¬ 
dement d’un passif et celui du contrat a terme. V entre alors nega- 
tivement dans la formule de la couverture. Celle-ci indique alors qu’il 
faut acheter des contrats a terme pour les fins de la couverture (N 
positif). En vertu de la correlation positive, les prix du passif et ceux 
du contrat a terme tendent a evoluer a l’unisson. Mais le passif etant 
une dette, lorsque la valeur du passif augmente, on espere recuperer 
cette perte par un gain sur le contrat a terme. Comme les prix du 
passif et du contrat a terme evoluent dans le meme sens, c’est en 
detenant des contrats a terme que 1’on pourra alors compenser cette 
perte par un gain sur le contrat a terme. Done, lorsqu’il existe une 
correlation positive entre le rendement d’un passif et celui d’un con¬ 
trat a terme, il faut acheter des contrats pour se couvrir. On laisse au 
lecteur le soin de developper les cas de couverture qui se rapportent a 
une correlation negative entre le rendement d’un actif (ou d’un passif) 
et celui du contrat a terme 5 . 


5. Nous avons estime le ratio de hedg ing pour le cas des BAX a la fin du chapitre 3. 
Cette section permet evidemment de mieux l’interpreter. 
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4.2. Line methode generale pour calculer 
une frontiere efficiente 

Nous nous attaquons maintenant au cas de la construction d’une 
frontiere efficiente. Celle-ci est le lieu des combinaisons rendement- 
risque optimales de portefeuilles. Pour chaque esperance de rende- 
ment donnee, la frontiere efficiente donne le portefeuille qui comporte 
l’ecart-type minimal, soit le risque minimal, pour cette esperance de 
rendement. La frontiere efficiente classique apparait a la figure A3-1. 


FIGURE A3-1 La frontiere efficiente classique 

E(R p )“ 



ou E(R p ) designe l’esperance du rendement d’un portefeuille et n(R p ), 
son ecart-type. Le probleme de la construction d’une frontiere efficiente 
consiste done a minimiser la variance du rendement du portefeuille: 

Var ( R p) = L w i w i a i) 

Wi etant la ponderation du titre i dans le portefeuille p, sous deux 
contraintes: 
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i) la contrainte d’un niveau donne de rendement espere E*: 

£w,E(Ri) = E* 

E(Ri) designant l’esperance de rendement du titre i; 

ii) la contrainte que la somme des ponderations des titres dans 
le portefeuille soit egale a 1’unite: 

Pour solutionner ce probleme en termes des w;, nous devons ecrire la 
fonction de Lagrange qui lui correspond: 

z = ^WiWjOij + ^[£w i E(r i )-E*] + E 2 [£w i -l] 
i-i 

Pour trouver le minimum, nous devons egaler les derivees premieres 
de cette fonction par rapport aux Wj et aux a 0. La solution donne 
alors les w; optimaux associes a E*. L’on insere ces Wi dans la formule 
de l’ecart-type, ce qui nous donne 1’ecart-type minimal associe a E*. 
On obtient un point de la frontiere efficiente: (cr*, E*). Et l’on refait 
cet exercice pour d’autres niveaux de E* de fagon a generer toute la 
frontiere efficiente. 

Notre propos est ici de formuler ce probleme d’optimisation 
sous forme matricielle. En termes matriciels, la fonction de Lagrange 
precedente s’ecrit: 

z = w T fiw + A,j [w T E- E*] + X 2 [w T 1-1] 

Les derivees pour trouver le vecteur w* optimal associe a E* sont les 
suivantes: 


— = 2Hw + ?i 1 E + ?i2l = 0 

3w 




- = w' E - E* = 0 


3z 

-= w 


T 


dl 2 


-1 = 0 
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Pour mieux visualiser comment solutionner ce systeme d’equa- 
tions en termes des wi, concentrons-nous sur le cas d’un portefeuille 
qui ne comprend que trois titres. En termes matriciels, ce systeme 
s’ecrit alors: 


'2a? 

2012 

2013 

Ei 

1 

W( 


' 0 ' 

2a 2 i 

2a] 

2a 23 

e 2 

1 

w 2 


0 

2g 31 

2a 32 

2a 33 

e 3 

1 

w 3 


0 

1 

1 

1 

0 

0 

K 


1 

. E i 

E 2 

e 3 

0 

0 

_^2 . 


E* 


En termes plus compacts, ce systeme s’ecrit comme suit: 

Cy = k 

ou y est le vecteur des inconnues, soit les wj et les \j. La solution 
s’obtient en inversant la matrice C : 

y = C -1 k 

On obtient alors le vecteur w* associe a E*. On peut des lors calculer 
le cr* correspondant, ce qui nous fournit un point de la frontiere 
efficiente: (ct* E*). On refait par la suite le meme exercice pour 
d’autres niveaux de E* de maniere a pouvoir tracer toute la frontiere 
efficiente 6 . 


6. A remarquer qu’il est tres facile de construire une frontiere efficiente sur Excel 
lorsque Ton dispose de la matrice variance-covariance des rendements des titres 
analyses en recourant aux fonctions matricielles PRODUITMAT (produit matri- 
ciel) et INVERSEMAT (inversion matricielle). En effet, le calcul de la frontiere 
efficiente ne met en jeu que ces deux operations matricielles. 
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4.3. Le modele de I'erreur de suivi 
(tracking error ) de Roll 7 

Nous envisageons ici le cas du gestionnaire qui controle un fonds 
investi dans une categorie d’actifs donnee. II apparait logique de mesurer 
sa performance par rapport a un indice de reference ( benchmark ) qui se 
compare bien a la composition dudit fonds. A cet effet, plusieurs 
maisons de courtage publient des indices de portefeuilles specialises. 
On peut alors comparer la performance d’un gestionnaire de porte- 
feuille a l’indice publie qui correspond le mieux a la composition de 
son portefeuille. 

Roll a propose une telle comparaison dans un article publie en 
1992 dans le Journal of Portfolio Management: «A Mean/Variance 
Analysis of Tracking Error ». Son but: est d’evaluer la performance 
d’un gestionnaire en le comparant au rendement d’un indice de refe¬ 
rence (benchmark) apparente au comportement du fonds gere par ledit 
gestionnaire. 

Mais avant de poursuivre, definissons un concept utilise dans cet 
article: I’erreur de suivi ou tracking error. Cet indicateur traduit une 
deviation de performance. C’est la difference entre le taux de rende¬ 
ment periodique du fonds et le taux de rendement de l’indice de 
reference. Un critere pertinent pour evaluer un gestionnaire est la 
minimisation du tracking error, mais cette minimisation doit certes 
s’effectuer sous contrainte. Fixons au gestionnaire l’objectif suivant: 
minimiser la variance du tracking error sous la contrainte d’un certain 
ecart positif de rendement relativement a 1’indice de reference. 

La valeur esperee de I’erreur de performance (G) se definit 
comme suit: 

G = (q p -q b ) T R = x T R 

ou q p est le vecteur de ponderation du portefeuille du gestionnaire 
vis-a-vis des N litres qui constituent le benchmark et q b , le facteur de 
ponderation de ces litres a l’interieur du benchmark. Dans le porte¬ 
feuille du gestionnaire comme dans le benchmark, la somme des pon- 


7. Roll, R. (1992), «A Mean/Variance Analysis of Tracking Error», Journal of 
Portfolio Management, Summer 1992. 
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derations des litres est egale a l’unite. Le vecteur x: de dimension 
(N X 1) represente des alterations de portefeuille qui s’autofinancent, 
c’est-a-dire: 

x T l = 0 

ou 1 est un vecteur (N x l) d’unites et x, Pecart entre les vecteurs q p 
et qb- Finalement, R: (N x l) est le vecteur des rendements anticipes 
des N titres. 

Fixons G a un niveau cible, soit a l’excedent positif de rendement 
impose au gestionnaire en regard du benchmark. Soit (R p - Rb)* cet 
excedent-cible. On a done: 

G=(R„-R b )* 

Soit a designer par V la matrice variance-covariance des N titres 
en cause. La variance du tracking-error est done: 

(q P -qb) Tv (q P -qb) = xT Vx 
Le probleme d’optimisation auquel est soumis le gestionnaire est 
le suivant. II doit minimiser la variance du tracking error : 

x T Vx 

sous les deux contraintes suivantes : 

i) les reamenagements de portefeuille qu’effectue le gestionnaire 
par rapport au benchmark doivent comporter une esperance de 
gain G positive, ce qui correspond a la cible recherchee: 

x t R = G 

ii) les reamenagements par rapport au portefeuille de reference 
doivent s’autofinancer: 

x T l = 0 

La fonction de Lagrange qui correspond a ce probleme d’opti¬ 
misation est la suivante: 

x t Vx + ?i 1 [G-x t r] + A, 2 [o-x t i] 
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Pour trouver le vecteur x optimal, on egale les derivees premieres 
de la fonction de Lagrange par rapport a x et aux a 0. Si nous 
derivons cette fonction par rapport au vecteur x et egalons cette 
derivee a 0, nous obtenons: 


Vx-^R-^^O 

Mettons le vecteur x en evidence: 


Vx = [R 



En multipliant les deux cotes par V' 1 , on obtient: 


x = V- 1 [R 



Pour trouver la solution, nous devons eliminer les deux multiplica- 
teurs de Lagrange. Pour y arriver, on multiplie les deux cotes de la 


derniere equation par le vecteur [r jj T : 

[R l] T x = [R lfv^R 



Nous remplagons le terme de gauche par les derivees de la 
fonction de Lagrange par rapport aux \j, qui sont egales a 0 dans la 
solution optimale. Ces derivees correspondent evidemment aux con- 
traintes du probleme d’optimisation. En effectuant cette substitution, 
on obtient: 
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En multipliant les deux cotes de la derniere equation par A *, on 
trouve finalement les valeurs des deux A. recherchees: 




h. 


= A 1 


G 


0 


Et en se referant aux calculs precedents, on trouve l’expression 
de la matrice A: 


R T V X R 


A = 


R t V 1 1 


R r y 1 i 

1 T V” 1 ! 


a b 
b c 


Le vecteur optimal x des reamenagements est le suivant: 


x = V- 1 [R 


1JA- 1 


G 


0 


On a done trouve les reamenagements du portefeuille de refe¬ 
rence ( benchmark ) qui minimisent la variance du tracking error et qui 
assurent un rendement espere positif G. 
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CHAPITRE 


4 

VARIATIONS SUR LES MODELES 
LINEAIRE ET NON LINEAIRE 
PARTI E I 


Dans ce chapitre, nous developpons plusieurs themes rattaches au 
modele lineaire general. Dans un premier temps, nous abordons les 
erreurs de specification de la forme fonctionnelle et les tests qui s’y 
rattachent. Certains de ces tests font appel aux techniques d’estima- 
tion non lineaires: ces techniques seront done introduites dans ce 
chapitre. Puis, nous nous penchons sur les criteres de selection des 
variables explicatives dans le modele de regression et sur d’autres 
criteres associes: criteres d’Akaike, de Schwartz, test J, test RESET. 
Ensuite, nous considerons les variables dichotomiques {dummy) et les 
tests ayant trait aux changements structurels. 


1. Erreurs de specification 

Nous abordons ici les erreurs de specification de la forme fonction¬ 
nelle reliees au cas des variables explicatives omises. Supposons que le 
vrai modele a estimer soit le suivant: 

y = XjPj + X 2 (3 2 + e 2 

alors que, par ignorance, on estime le modele suivant: 

y = X 1 (3 1 +ej 

ou = X 2 (3 2 +e 2 ~ IID^O, a 2 I T j. Quelles sont les consequences de 
cette erreur de specification sur l’estimateur des MCO ? En estimant 
par les MCO la derniere equation, on a: 
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P,=(x 1 T X,)~‘x i T y 

= (x, T X 1 )' 1 X 1 T (X 1 p 1 +X ; |5 2 +e 2 ) 

= Pi + (Xi T Xj J 1 Xj T X 2 P 2 +(x, T X,) ‘x, T e 2 


Calculons maintenant 1’esperance de f>, : 


= P, +e^(x, t x,) ’x, T x 2 p 2 J+o 

= |5,+[(x 1 T X 1 )" 1 X 1 T X 2 p 2 j*p 1 


De ces developpements, il resulte que si Ton omet une variable expli¬ 
cative et si Xi n’est pas orthogonal a X 2 et (3 2 ^ 0, alors (3, est biaise. 

Examinons maintenant le cas ou l’on ajoute trop de variables 
explicatives. Le vrai modele est les suivant: 

y = X 1 (3 1 + e x 

Or, on estime plutot le modele suivant: 

y = X 1 (3 1 +X 2 (3 2 +e 2 

ou ei = e 2 puisque P 2 = 0. Appliquons les MCO sur le dernier modele 
et degageons-en les consequences. 


e= x 'x 


X.P.+e,) 


V 


(x T x) ^^XjPj +(x T x)” 1 X 1 T X 1 e 1 

.P2. 


(x T x)-X 2 T X 1 p 1+ (x T x)- 1 X 2 T X 1 e 1 
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Calculons l’esperance de (3 : 


pr 

0 

puisque X 2 est suppose orthogonal a Xi, X 2 n’apparaissant pas dans le 
vrai modele. L’estimateur de p est done sans biais. Cependant, il est 
inefficient parce que Ton sait que c’est le premier modele qui est 
correctement specific. Ce probleme est done moindre que celui de 
l’omission de variables explicatives. 

Passons maintenant aux problemes suscites par les erreurs de 
specification sur la variable dependante. Supposons que Ton ait estime 
le modele suivant: 



y t =PiX t +e lt 

alors que le vrai modele est: 

ln (yt) = P 2 x t + e 2 t => yt = exp(p 2 x t + e 2t ) = exp(p 2 x t )exp(e 2t ) 

En appliquant les MCO sur 1’equation correspondant a la mauvaise 
specification, on a: 

p = (X T X) _1 X T exp(p 2 X)exp(e 2 ) 

En calculant l’esperance de P, on a : 

E (p) = (x T x) _1 X T exp(p 2 X)E(exp(e 2 )) 

= (x T x ) _1 X T exp(p 2 X)expj^y j * p 

Nous recourons a certains resultats de la distribution lognormale pour 
calculer l’esperance de e 2 . Soit x = ln(y), ou x ~ N(0, ct 2 ). Alors 

. . / x fE(x)+iv(x)l V 

E(y) = El e x 1 = e v - e 2 .La variance de y est par ailleurs 
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de: V(y) = e^ 2E ^ x ^ +V ^ x ^e^ V ^ x ^-lj = e° -lj. Une erreur de 

specification sur la variable dependante entraine egalement un biais au 
chapitre de 1’estimateur des MCO. 


2. Tests relies aux erreurs de specification 


2.1. Test sur la forme logarithmique 


On veut choisir l’un des deux modeles suivants : 


Yt = Pl+p2 x 2t+p3 x 3t+ e Lt 
ln (y t ) = Yl + Y 2 x 2 t + Y3 x 3t + e LLt 


Box et Cox ont formule un test pour discriminer entre ces deux 
modeles. II faut d’abord exprimer le premier modele en unites compa¬ 
rables au second. Pour ce faire, on calcule la moyenne geometrique de 


y t : y G = (y; Xy 2 X... X y T )t . On peut ecrire une formule equiva- 
lente de la moyenne geometrique en exprimant cette demiere equa¬ 
tion sous forme logarithmique: 


— I>y t 

y G =e Tt=1 . Ce resultat est utilise pour 


^ i 

hl (YG) = -Llny 

calculer la somme des carres residuels transposes en unites compa¬ 
rables a celles du deuxieme modele. On obtient, apres application des 
MCO sur le premier modele: 


scr l = Cl 

yc 

Par ailleurs, en appliquant les MCO sur la deuxieme equation, on a: 

SCR ll = e LL e LL 

On est maintenant en mesure de construire le test suggere par Box- 
Cox en 1964: 
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1 = 


T 

2 


In 


SCR L /y G 2 

scr ll 


x 2 (i) 


La formulation du test est la suivante: 

HO : les deux modeles sont equivalents 
HI : les deux modeles ne sont pas equivalents 

La premiere etape du test consiste a calculer la statistique 1. On rejette 
HO si 1 >l c au niveau a. Dans une deuxieme etape, on discrimine entre 

SCR 

les deux modeles. On choisit le modele lineaire si: - y- < SCR LL . 

yG 

On choisit le modele logarithmique dans le cas inverse. 


2.2. La transformation de Box-Cox 


Le test precedent est plutot restrictif car il nous limite au couple 
modele lineaire-modele logarithmique. La transformation Box-Cox 
s’avere beaucoup plus flexible, car elle nous laisse le choix entre plusieurs 
modeles, entre autres les modeles lineaire simple, logarithmique et 
beaucoup d’autres comme le modele non lineaire. Pour effectuer une 
telle transformation, il faut reformuler les variables dependantes et 
independantes comme suit. Supposons a cet effet le modele suivant: 

Y t = Pl + p2 x 2t + p3 X 3t + e t 

La transformation Box-Cox des variables de ce modele est la suivante: 


v M_It Zl. X w_ x 2t-1. W_ x 3t-1 

yt — 5 x 2t — ’ x >t — 

XIX 

Cette transformation implique les relations suivantes pour y: 


>) = 


71-1 
X 

Hvt) 


si X ^ 0 
si X = 0 
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Et ces relations valent egalement pour les Xj t . 

Demontrons ces relations. Pour ce faire on doit calculer la limite 
de l’expression suivante: 


yt-i. 


lim 


d (y^- 1 ) 

dX 

dX 

d?i 


Pour pouvoir effectuer ce calcul, on recourt a deux regies: la regie de 
l’Hopital et une regie de derivation. La regie de l’Hopital s’ecrit 
comme suit: 



ou m(x) et n(x) sont des fonctions continument differentiables. 

Par ailleurs, la regie de derivation requise est la suivante. Soit la 
fonction: 

f(.) = x b 

La derivee de cette fonction est: 


dfQ 

db 


ln(x) x b 


On se sert de cette regie pour determiner le numerateur de la regie de 
l’Hopital: 




ax. 




La derivee du denominateur de la regie de l’Hopital est triviale. Ces 
calculs impliquent que: 

jimyt ln (y t ) = ln (y t ) 
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Precisons les diverses formes d’equations que peut accommoder la 
transformation Box-Cox. Si X = 1, on revient au modele lineaire. Si 
X = 0, on a la forme logarithmique. Si X = 2, on a une forme quadra - 
tique. Et ainsi de suite. Ce modele non lineaire s’estime par la methode 
du maximum de vraisemblance. II convient de souligner que pour les 
modeles non lineaires, les tests ne valent qu’asymptotiquement. 

On veut maintenant tester les deux hypotheses suivantes : 

HO:X = 0 
HI: X^O 


On construit le ratio t asymptotiquement normal: 


t = . -> N(0,l). On rejette HO si: t > 1,96 pour 


5%. 


3. METHODES DES MOINDRES CARRES NON LINEAIRES 
ET TRANSFORMATION BOX-COX 

La methode des moindres carres non lineaires se presente comme 
suit. Soit le modele de regression non lineaire suivant: 

Yt = f ( x t-P) + e t 

Pour estimer le vecteur de parametres b, on minimise: 

MnS(|S) = Mm£(y,-f(x t ,|S)) 2 

Les methodes non lineaires recourent a des algorithmes d’opti- 
misation. Nous presentons d’abord le plus connu, soit l’algorithme de 
Newton-Raphson, qui fait appel au processus iteratif suivant: 



Representons a la figure 4.1 la procedure decrite par cette 
equation. 
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Figure 4.1 



On veut trouver le minimum de S(P) qui correspond au point ou 
S'((3) = 0- La procedure Newton-Raphson consiste a initier 1’algo- 
ritnme au point bo et a evaluer a ce point S(P) et S’(P). Si S'((3 0 ) > 0, 

S(p 0 ) 

cela implique que —-—- > 0. Mais comme ce ratio est affecte d’un 

S'(Po) 

signe negatif, alors sur la figure 4.1 la direction sera vers la gauche. On 
obtient alors Pi, que l’on remet dans l’equation precedente pour 
obtenir p 2 et ainsi de suite jusqu’a ce que l’ecart entre p n et p n+ i soit 
tres petit. 

La methode de Newton-Raphson qui vient d’etre presentee ne 
tient pas compte de la courbure de S(P). Une methode qui en tient 
compte est celle de Newton. Cet algorithme s’ecrit comme suit: 
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Cette equation est derivee de ^approximation de Taylor. Dans cette 
expression, la courbure de S(|3) est evaluee par sa derivee seconde. 

Envisageons ici le cas des moindres carres lineaires 1 . Situons- 
nous a la premiere iteration. La formule de Newton s’ecrit alors: 


p 2 =Pi 


s'(P.) 

S"(P.) 


II suffit alors de minimiser la somme des carres residuels : (y - X(3) ' 
(y-X(3). Calculons les derivees premieres qui apparaissent dans la 


formule iterative. S'((3!) = 


d(y ~ X(3) T (y - X(3) 

3(3 


= 2X t (y - X(3), soit 


, N 3 2 (y - X(3) T (y - X(3) 

les equations normales. S"((3)—---- = 2X T X. La for- 

(3P) 2 

mule de Newton s’ecrit done dans ce cas: 


(3 2 = pj + (X T X) _1 (x T y - X t X( 3 1 ) = pi + p - pj = p 

Pour les MCO, la methode de Newton converge en une seule itera¬ 
tion. La derivee premiere represente la direction du deplacement et la 
derivee seconde, l’acceleration du mouvement 2 . 

Le probleme relie aux calculs numeriques est qu’ils s’averent 
intensifs en calculs. La methode de Gauss-Newton vient pallier en 
partie a ce probleme en evaluant la derivee seconde par un produit de 
derivees premieres. Cette methode s’ecrit comme suit: 

P n+1 =(3 n -p n d n 


1. Hendry, D.F. (1995), Dynamic Econometrics, Oxford University Press, Oxford. 

2. Ou encore, elle tient compte de la courbure de la fonction a minimiser. 
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OU d n 




Pour illustrer la methode Gauss-Newton et, par le fait meme, les 
autres methodes, supposons la regression non lineaire suivante, qui 
nous sert a estimer le coefficient Pi 3 . 

Jt = P x n +P 2 x 2t +e t 

Ce modele est de la forme: y t = f(p) + e t . Cette equation fait appa- 
raitre un produit de parametres, c’est-a-dire que lorsque l’on mini¬ 
mise la somme des carres residuels, on n’obtient pas une forme 
explicite pour 1’estimateur de p. Supposons en effet qu’on minimise 
S(P), qui est egal a: 

s (P) = E(y t -P x it-P 2x 2t)- 

t=i 

En egalant la derivee de cette fonction a 0, on obtient: 

= 0 => E(yt - P x n - P 2x 2t )(- x n - 2 P X 2t ) = 0 

dp t =i 

On remarque qu’il n’y a pas de solution analytique pour p. On doit 
done recourir aux methodes numeriques pour trouver une solution 
pour p. Dans ce cas-ci, f t , qui apparait dans l’algorithme de Gauss- 

Newton, est egal a: f t = Px lt + p 2 x 2t . D’ou: = x lt +2Px 2t , ce qui 

dp 

est requis pour le calcul de p n . Finalement, d n est egal a la derivee de 
S par rapport a p evalue a p n . Par consequent, le processus iteratif est 
le suivant: 


Pn+i - 




£( x it+2p x 2t) 2 



3. Cet exemple est emprunte a: Griffiths, W.E., C. Hill et G.G. Judge (1993), 
Learning and Practicing Econometrics, John Wiley, New York. 
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Une autre application des moindres carres non lineaires est d’estimer 
la transformation Box-Cox du modele de regression suivant de la 
demande de monnaie aux Etats-Unis 4 : 

ln(M t ) = pj + |3 2 r t W + |3 3 y t W + e t 

ou M t est la masse monetaire americaine au sens de M2, r t , le taux 
d’escompte de la Reserve federale americaine et y t , le produit national 
brut en dollars constants. Pour estimer les parametres de cette equa¬ 
tion, on applique les moindres carres non lineaires. Les hypotheses a 
tester sont les suivantes : HO: A. = 0; III: A. ^ 0. Pour ce faire, il faut 
construire la statistique t qui obeit asymptotiquement a la distribution 
normale. On rejettera HO si le t calcule est superieur au seuil critique 
donne par la loi normale. 

Jusqu’ici, a l’interieur de la presentation des methodes nume- 
riques, nous n’avons envisage que le cas univarie. Le cas de la regression 
de Box-Cox en est cependant un ou il existe plusieurs parametres a 
estimer. La formulation generate du modele de regression non lineaire 
multivarie est la suivante: y t = f (x t , (3) + e t . Pour le cas de la regres¬ 
sion Box-Cox: (3 t =[(3j (3 2 P 3 ^]- Pour estimer ces para¬ 

metres, Palgorithme d’optimisation requiert 1’evaluation 


as as as as as ^ 

— = - - - — . Ce vecteur est appele: gradient, 

ap [api a(3 2 ap 3 axj 

qui est un vecteur de derivees premieres. Dans le cas multivarie, pour 
utiliser les algorithmes de Newton-Raphson, de Gauss-Newton ou de 
Newton, il suffit done simplement de remplacer les derivees simples 
par les derivees partielles. 


A titre d’exemple d’une regression non lineaire, considerons un 
modele de determination de la structure a terme des taux d’interet. Ce 
modele, associe a Haugen (1993) 5 , relie le rendement des obligations 
americaines a leur echeance, de fagon a determiner la courbe de leur 
structure a terme. Cette equation est la suivante: 


y i =(a I +a 2 t i je- a 


4. Voir Greene, W.H. (2000), Econometric Analysis, Prentice Hall, New York. 

5. Haugen, R.A. (1993), Modem Investment Theory, troisieme edition, Prentice Hall, 
New York. 
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ou yi est le rendement a l’echeance de l’obligation de categorie i, tj, 
l’echeance correspondante de cette obligation et a;, les divers coeffi¬ 
cients qui servent a ajuster la courbe. Cette regression est a 1’evidence 
non lineaire. Les parametres ai a a 4 sont estimes par le logiciel Eviews 
par la methode des moindres carres non lineaires. II faut bien sur fixer 
des valeurs de depart {seed values ) pour les coefficients ai a a 4 . Les 
commandes pour effectuer cette regression sur EViews apparaissant 
au tableau 4.1. 

Tart, fait 4.1 
smpl 1 50 

' Estimation de la courbe des rendements a l’echeance a partir de yld 6 et tm 
' Declaration des parametres de depart: 

PARAM c(l) -.49 c(2) .1 c(3) .1 c(4) .1 
NLS yld=((c(l)+c(2)*tm)/exp(c(3)*tm))+c(4) 


Les coefficients estimes par NLS sont les suivants: ai = -45,96; 
a 2 = -0,6285; = 5,5842 ; a 4 = 0,0783. La representation graphique 

de la structure a terme observee un 13 mars pour les obligations 
federales americaines de diverses echeances et de la structure a terme 
estimee apparait aux figures 4.2 et 4.3. 


6. yld designe le rendement a l’echeance et tm, l’echeance. 
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4. Criteres de selection 

DES VARIABLES EXPLICATIVES 

Dans cette section, nous abordons les differents tests statistiques qui 
servent a verifier les modeles theoriques. Rappelons d’abord rapide- 
ment les differents tests examines jusqu’ici pour la meme fin. Nous 
avons etudie le test t, servant a tester un seul parametre dans sa 
presentation classique, le test F, servant a tester un sous-ensemble ou 
l’ensemble des parametres d’une regression, et le R 2 ajuste, qui sert 
egalement a evaluer l’ensemble des parametres d’une regression. 

II convient maintenant de presenter d’autres criteres classiques 
pour selectionner les variables explicatives d’un modele. Dans la meme 
veine que le critere du R 2 ajuste, les criteres d’information d’Akaike et 
de Schwartz visent egalement a evaluer le degre d’ajustement d’un 
modele tout en tenant compte de l’ajout de nouvelles variables expli¬ 
catives. Le critere d’Akaike pour le modele i, designe par AIQ 7 , se 
definit comme suit: 



ou SCRj est la somme des carres residuels du modele i; T, la taille de 
l’echantillon; kj, le nombre de variables explicatives. On est confronte 
a plusieurs modeles et celui qui minimise le critere AIC est celui qui 
sera retenu. A l’instar du R 2 ajuste, ce critere prend en compte le 
nombre de degres de liberte. En raison de la presence du logarithme, 
ce critere peut dormer lieu a des nombres negatifs. On choisit alors le 
modele qui comporte l’AIC le plus faible. Un autre critere, celui de 
Schwarz, designe par SC ou SBC 8 , se definit comme suit: 



Le critere SC s’interprete de la meme fagon que le critere AIC, c’est- 
a-dire que Ton choisit le modele qui minimise le critere SC. Le critere 
SC comporte des proprietes asymptotiques superieures au critere AIC. 
Le critere AIC est biaise en faveur des modeles surparametrises. 


7. Abreviation de Akaike information criterion. 

8. Abreviation de Schwarz criterion (SC) et de Schwarz Bayesian Criterion (SCB). 
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Le test J 

Le test J propose par Davidson et McKinnon 9 tire son appellation de 
l’expression anglais & jointly estimating. Si les criteres de decision pre¬ 
cedents favorisent un modele, il n’en reste pas moins que la procedure 
suivie est plus ou moins rigoureuse. Une procedure plus satisfaisante 
consiste a tester conjointement (simultanement) deux modeles con¬ 
currents. Le test J est alors tout designe. 

La procedure du test J est la suivante. On veut tester les deux 
hypotheses. HO : y = X(3 + e t contre HI : y = Zy + e 2 - Theorique- 
ment, on teste ces hypotheses en recourant a la strategic du nesting, 
que 1’on peut traduire par « strategie de 1’imbrication », pour ecrire la 
relation suivante: 

y = (l-a)X(3 + aZy + e 

Tester HO revient a verifier si a = 0. En pratique, le test, qui fait appel 
a la technique des regressions artificielles, s’effectue en trois etapes: 
i) regresser y sur Z. On obtient: y * = Zy ; ii) regresser y sur X et y * : 
y = XQ. + ay * + e. On obtient a ; iii) on construit le test t asympto- 

6c — 0 d 

tique- r =->N(0,l). On rejette HO si la valeur absolue de t 



excede la valeur critique. 


Le test RESET 

Par ailleurs, le test RESET 10 , qui est Pacronyme de l’expression anglaise 
REgression Specification Error Test, est, comme son nom Pindique, 
un test general d’erreurs de specification, par exemple les erreurs 
omises ou les erreurs de forme fonctionnelle. Pour effectuer ce test, 


9. Davidson, R. et J. McKinnon (1981), « Several Tests for Model Specification in 
the Presence of Alternatives Hypotheses », Econometrica, 49, p. 781-793. 

10. Ce test est redevable a Ramsey, J.B. (1969), «Tests for Specification Error in 
Classical Linear Least Squares Analysis », Journal of the Royal Statistical Society, 
Series B, 31, p. 350-371. Voir aussi: Ramsey, J.B. et P. Schmidt (1976), «Some 
Further Results on the Use of OLS and BLUS in Residuals in Specification 
Error Tests », Journal of the American Statistical Association, 71, p. 389-390. 
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on suit la procedure suivante. On veut tester si le modele y = X(3 + e, 
ou e ~ N(0, ct 2 I), est specifie correctement. Ce test comporte trois 
etapes: i) on applique d’abord les MCO sur cette equation et on 
obtient y = X(3 ; ii) on ecrit la regression suivante: 

y = X0 + y 1 y 2 +y 2 y 3 +1^ +u 

ou u ~ N(0, ct 2 I). On applique les MCO sur cette equation pour 
obtenir les 0 et les y ; iii) on construit la statistique F pour tester les 
hypotheses suivantes en supposant que le vecteur q comporte trois 
parametres : HO : R(3 = r contre HI : R(3 ^ r, soit: 


RP = 


Le test F s’ecrit: 


0 0 0 1 0 0 

0 0 0 0 1 0 

0 0 0 0 0 1 


'o' 

0 


0 


F= SCR R -SCR u /q 
SCRu/T-k 

ou q est egal au nombre de restrictions, 3 dans le cas qui nous inte- 
resse, et k, le nombre de parametres a estimer, est egal a 6. SCRr est 
la somme des carres residuels du modele contraint (y = 0) et SCRu est 
la somme des carres residuels du modele non contraint (y ^ 0). On 
rejette HO si F est superieur au F critique. Si ce test rejette l’hypothese 
HO, cela indique la presence probable d’une erreur de specification au 
chapitre du modele. Mais le test reste muet sur Pidentite de l’erreur de 
specification. 


~F(q,T-k) 
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5. Variables auxiliaires et modelisation 

DES CHANGEMENTS STRUCTURELS 

La theorie des options s’est enormement developpee depuis que Black 
et Scholes ont presente leur fameux modele sur la determination du 
prix d’une option d’achat europeenne en 1973. Depuis cette epoque, 
les categories d’options se sont demultipliees. Elies ont meme deborde 
le secteur financier pour envahir le secteur reel. A titre d’exemple, il 
existe plusieurs categories d’options dans le secteur de l’energie tels 
les caps sur le prix de la gazoline. II est done important dans cas de se 
dormer un modele de fixation du prix de la gazoline qui represente ici 
le sous-jacent du cap. Examinons comment l’econometrie peut nous 
aider a definir un tel modele. Cet exemple nous sert egalement de 
pretexte pour introduire les variables auxiliaires 11 . 

Supposons a cet effet un modele tres simple de depenses en 
gazoline definies en fonction du revenu et du prix, les deux premieres 
variables etant definies sur une base reelle et per capita. Le modele se 
presente comme suit: 

lndep t =(3 1 +p 2 lny t +(3 3 lnp t +e t t = 1930,...,1970 

ou dep t represente les depenses en gazoline, y t , le revenu et p t , le prix 
de la gazoline. Nous savons que de 1939 a 1945, il y eut une guerre 
mondiale qui s’est traduite par une diminution marquee des depenses 
de consommation, entre autres de la gazoline. Durant cette periode, les 
parametres de la fonction des depenses en gazoline se sont modifies. 
Une fagon de capter ce changement est d’introduire dans le modele 
une variable auxiliaire. Les variables de cette categorie sont du type 
dichotomique ou binaire qui, dans notre cas, prend la forme suivante: 

D _ Jl si la caracteristique est presente 

[O sinon 

Dans le cadre de notre modele, D = 1 si t = 1939,..., 1945 et D = 0 
ailleurs. Cette variable s’introduit comme suit dans notre modele de 
regression: 

lndep t = (3 lt + (3 2t lny t +(3 3t lnp t +e t t = 1920,...,1970 


11. Qui sont designees par dummies en anglais. 
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Ce modele est dit a coefficients variables ou Pi t =Pi+8D t et 
P 2t =P 2 +YD t - Pour simplifier, nous supposons que: P 3t = P 3 . Ce 
modele est represente a la figure 4.4 en fixant p au niveau constant p. 


Figure 4.4 


CD 



(1) : E(lndep) = bi + b 2 In y + b 3 In p 

(2) : E(lndep) = bi + d + b 2 In y + b 3 In p 

(3) : E(lndep) = bi + d + (b 2 + g) In y + b 3 In p 

On peut tester les hypotheses suivantes: i) HO : y = 0 contre HI: 
y ^ 0; ii) HO: 8 = 0 contre HI : 8 ^ 0; 


'5' 

_ 

'o' 

contre HI: 

'8' 

* 

'o' 

. Le premier test concerne le 

y. 


0 


_Y_ 


_0 



changement de la pente de la droite de regression. Ce test peut etre 
effectue a l’aide d’un test t standard. II peut etre formule comme suit: 
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y_Q 

t = . ~ t(T-5), en supposant certes que les residus sont nor- 

malement distribues. 

Le second test concerne le deplacement parallele de la droite de 
regression. C’est la le test classique d’un changement structurel. Si 
l’on rejette HO, il y a alors ici diminution des depenses en periode de 
guerre. A 1’instar du premier, ce test peut aussi s’effectuer par le test 
t. Finalement, le troisieme test est le F de Fisher. Cette statistique se 
construit comme a l’accoutumee, en faisant appel aux residus con- 
traints et non contraints. Ce test sert a verifier les hypotheses con- 
jointes d’un deplacement parallele et d’un changement de pente. 

Le cas suivant sert egalement a utiliser l’emploi des variables 
instrumentales. II consiste a estimer l’impact de certains jours de la 
semaine sur le cours des actions. Comme on le sait, les cours des 
actions a tendance a baisser systematiquement le lundi. Pour tester cet 
effet, on recourt a l’equation suivante associee a Connolly (1989) 12 : 

r t = (3 0 + (3 2 T t + (3 3 th t +(3 4 f t +e t 

ou r t designe le rendement journalier de l’indice Standard & Poor’s 
500 pour les annees 1972 et 1973 ; m t , T t , th, et f t sont des variables 
auxiliaires qui identifient respectivement les jours suivants: lundi, 
mardi, jeudi et vendredi; et e t est le terme d’erreur. Pour generer les 
variables auxiliaires, nous avons effectue en recourant au logiciel 
EViews le programme apparaissant au tableau 4.2. 


12. Connolly, R.A. (1989), «An Examination of the Robustness of the Weekend 
Effect », Journal of Financial and Quantitative Analysis, juin, vol. 24, n° 2. 
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Tart, fait 4.2 


smpl 1 503 
genr m72=0 
genr t72=0 
genr w72=0 
genr th72=0 
genr f72=0 

1 Debut de la boucle for 
for !i=0 to 502 

if day72(!i+1)=1 then 
genr m72(!i)=1 
else 

genr m72(!i)=0 
endif 

if day72(!i+1)=1 then 
genr t72(!i)=1 
else 

genr t72(!i)=0 
endif 

if day72(!i+1)=1 then 
genr w72(!i)=1 
else 

genr w72(!i)=0 
endif 

if day72(!i+1)=1 then 
genr th72(!i)=1 
else 

genr th72(!i)=0 
endif 

if day72(!i+1)=1 then 
genr f72(!i)=1 
else 

genr f72(!i)=0 
endif 

next 


En appliquant les MCO a l’equation precedente, on obtient les 
resultats apparaissant au tableau 4.3. 
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Tart, fait 4.3 


LS// Dependent Variable is LOG(SP50072/SP50072(-1))*100 

Date: 12/13/99 Time: 21:54 

Sample (ajusted): 2 503 

Included observations: 502 after adjusting endpoints 

Variable 

Coefficient 

Std. Error 

t-Statistic 

Prob. 

C 

0.043659 

0.080335 

0.543455 

0.5871 

M72 

-0.319821 

0.117947 

-2.711565 

0.0069 

T72 

0.028880 

0.114167 

0.252962 

0.8004 

TH72 

0.015556 

0.113887 

0.136589 

0.8914 

F72 

-0.017636 

0.113887 

-0.154857 

0.8770 

R-squared 

0.023408 

Mean dependent var 

-0.008239 

Ajusted R-squared 

0.015548 

S.D. dependent var 

0.825708 

S.E. of regression 

0.819264 

Akaike info criterion 

-0.388788 

Sum squared resid 

333.5829 

Schwarz criterion 

-0.346770 

Log likelihood 

-609.7212 

F-statistic 


2.978156 

Durbin-Watson stat 

1.562695 

Prob(F-statistic) 

0.018937 


On observe au tableau 4.3 que seule la variable m t , dont le 
coefficient estime est de -0,3198, est significative avec une p-value 
egale a 0,0069. On verifie done que, parmi les jours de la semaine, seul 
le lundi presente une anomalie. Les rendements boursiers n’auraient 
done tendance a diminuer que le lundi. Cependant, il semble que 
cette anomalie ait eu tendance a se resorber par la suite. 


Le test de Chow 

Ce test, issu de Chow 13 , vise a verifier la stabilite des parametres d’une 
regression. Supposons le modele suivant: 

y t =P T x t + e t t = 1,..., T 

ou x t = [x lt x 2t . . . x^]. Le test de Chow consiste, 

dans le cadre de ce modele temporel, a separer l’echantillon en deux: 


13. Chow, G.C. (1960), «Test of Equality between Sets of Coefficients in Two 
Linear Regressions », Econometrica, 52, p. 211-222. 
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1) la premiere partition s’etire du debut de l’echantillon jusqu’a la date 
du changement structurel; 2) la deuxieme partition a trait a 1’echan- 
tillon observe apres la date du changement structurel. On effectue une 
regression sur chacune de ces deux sous-periodes et sur 1’ensemble de 
la periode, soit la somme des deux sous-periodes. Le test F se formule 
alors comme suit: 

_ (SCR t - (SCI^ + SCR 2 )) / k 
(SCRj + SCR 2 ) / T - 2k 

ou SCRt est la somme des erreurs residuelles sur 1’ensemble de 
l’echantillon; SCRi, la somme des erreurs residuelles sur la premiere 
sous-periode et SCR 2 , la somme des erreurs residuelles sur la deuxieme 
sous-periode. 

On retrouve un test de Chow applique a un exemple financier 
dans Mills (1999) 14 . II vise a verifier la stabilite des parametres de 
l’equation du CAPM en faisant appel a des statistiques corporatives. 
Un extrait de son etude apparait au tableau 4.4, ou NONLIN signifie 
RESET; NORM: Jarque-Bera; et HET: test d’heteroscedasticite. 
Prenons le cas de Citicorp. La regression suivante de l’equation de la 
SML est estimee pour cette compagnie sur des donnees mensuelles de 
janvier 1978 a decembre 1987. 

r it “ r ft = oc + (3[r mt -r ft ] + e t 

ou ri t designe le rendement de la compagnie i, ici Citicorp; rft est le 
taux sans risque; r mt , le taux de rendement du marche et e t est le terme 
d’erreur. On veut tester la stabilite conjointe des coefficients a et p. 
Selon le CAPM, a doit etre egal a 0 et @ doit demeurer constant dans 
le temps. Pour effectuer le test de Chow, on fixe le point de rupture 
a decembre 1984. On divise done l’echantillon en deux parties, soit de 
janvier 1978 a decembre 1984 et de janvier 1985 a decembre 1987. On 
effectue des regressions sur 1’ensemble de l’echantillon et sur ses deux 
partitions et on calcule la somme des carres residuels pour ces trois 
regressions. On obtient: 


14. Mills, T.C. (1999), The Econometric Modelling of Financial Tmie Series, deuxieme 
edition, Cambridge University Press, Cambridge. 
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F _(SCR T -(SCR 1 +SCR 2 ))/k_ 6 
(SCRj + SCR 2 ) / T - 2k 

Ce test est significatif au niveau de 5 %. On rejette l’hypothese nulle 
de la stabilite du (3 d’un sous-echantillon a l’autre. L’auteur effectue 
egalement d’autres tests sur cette equation, dont le test RESET que 
nous avons deja presente. Ce test vise ici a tester la forme fonction- 
nelle de l’equation de la SML. Sous EIO: le modele est bien specifie. 
Et sous HI: le modele est mal specifie. La valeur du test RESET 15 est 
ici de 0,40, ce qui donne a penser que le modele est bien specifie. On 
retrouve ce test au tableau 4.4. 

Le test de Chow presente le desavantage suivant. Dans certains 
sous-echantillons, il est possible qu’il y ait une penurie d’observations 
puisque le point de rupture peut separer l’echantillon total en deux 
partitions tres inegales. Le test de Chow {predictive ) corrige par Fisher 
en 1970 vient pallier ce desavantage. Ce test s’ecrit comme suit: 



e T e/n 2 -k 


~ F ( ni ,n 2 


-k) 


ou e* T e* est la somme des carres residuels (contraints) 16 sur l’ensem- 
ble de 1’echantillon (SCRt) et e T e, la somme des carres residuels 
(non contraints) definie sur le sous-echantillon qui comporte le plus 
grand nombre d’observations. 


15. Pour effectuer le test RESET, on a regresse les residus de l’equation de la SML 
sur (r m - rf) et (r ; - rf) 2 estimes. 

16. La contrainte etant que les parametres sont identiques a travers l’ensemble de 
l’echantillon. 
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(0.0046) (0.07) 

[0.0054] [0.07] 







[60 0] [ ISOO'O] 



: Chow’s (1960) test for coefficient stability: break point taken to be December 1984. 

Mills, T.C. (1999), The Econometric Modelling of Financial Time Series, 2 e edition, Cambridge University Press, Cambridge 
(Reproduit avec la permission de l’editeur) 







CHAPITRE 


5 

VARIATIONS SUR LES MODELES 
LINEAIRE ET NON UNEAIRE 
PARTIE II 


Dans ce chapitre, nous introduisons d’abord la theorie asymptotique 
et les tests s’y rapportant: LM, LR et Wald. Puis nous examinons les 
problemes causes par la multicollinearite au chapitre des variables 
explicatives. Finalement, nous nous penchons sur le phenomene de 
l’endogeneite des variables explicatives. 


1. Theorie asymptotique: convergence, tests 

ASYMPTOTIQUES ET VARIABLES INSTRUMENTALES 


1.1 Convergence 

La theorie asymptotique est maintenant a ce point avancee que la 
plupart des proprietes lineaires et non lineaires des estimateurs et, 
partant, des tests, font appel a cette theorie. Les proprietes des 
estimateurs relies aux petits echantillons sont beaucoup moins con- 
nues meme si, ces dernieres decennies, il s’est produit une grande 
amelioration au chapitre des techniques de travail empirique en 
matiere devaluation de ces proprietes 1 . II existe quatre modes de 
convergence. 


1. On pense ici par exemple a l’utilisation beaucoup plus poussee de certaines 
techniques de simulation de type Monte Carlo et bootstrapping et des methodes 
de reduction de la variance. 
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i) La convergence en probabilite. C’est le mode de convergence le 
plus connu. Elle se definit comme suit. Supposons un 
estimateur 0 T de 0. On dit que l’estimateur 0 T converge en 
probabilite vers 0, c’est-a-dire: 0 T —> 0, si: 

Urn Prjj§ T - ©| < e| =*'J 

au fur et a mesure que la taille de l’echantillon devient impor- 
tante. Une notation plus compacte de ce mode de conver¬ 
gence firequemment utilisee dans la litterature est la suivante: 

plim0 T = 0 

Les conditions suffisantes pour verifier la convergence asymp- 
totique en probabilite sont les suivantes, en termes de l’espe- 

rance et la variance de 0 T : = 0 et V ^0 T j = 0. 

Sous certaines conditions tres generates, on peut verifier la 
convergence asymptotique en probabilite seulement en cal- 
culant l’esperance asymptotique. Pour un traitement rigou- 
reux de ce dernier sujet, on consultera White (1984) 2 . Et 
pour une application de ce concept, on se reportera a: Racicot 
(2000) 3 . 

ii) La convergence en moyenne quadratique. On dit qu’un estimateur 
0 T converge en moyenne quadratique vers q, i.e. 0 T —> 0, 
si: 

tern E^|e T -©| j = 0 

Ce mode de convergence est plus fort que celui de la conver¬ 
gence en probabilite. En effiet, si les conditions anterieures 
ayant trait a 1’esperance et a la variance asymptotique sont 


2. White, H. (1984), Asymptotic Theory for Econometricians, Academic Press, New 
York. 

3. Racicot, F.-E. (2000), Estimation et tests en presence d’erreurs de mesure sur les 
variables explicatives: verification empirique par la methode de simulation Monte 
Carlo, Centre de recherche en gestion, serie Finance empirique et quantitative, 
document de travail CRG-09-2000. 
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respectees, alors 0 T —> 0. II s’ensuit que: plim0 T = 0, soit 

p 

en notation courante : 0 T —> 0 ; 

iii) la convergence quasi sure (almost sure , abrege pas a.s.). On a ici 
la forme de convergence la plus forte. On dit qu’un esti- 
mateur 0 converge de fagon quasi sure vers q, i.e. 0 T —>0, si: 



iv) la convergence en distribution 

Supposons deux series: 0 T et q. Une serie 0 T converge en 
distribution vers une serie 0 si la fonction de distribution fy 
de 0 T converge vers la distribution f de 0 pour chaque point 
de f. Par exemple, supposons un estimateur 0 T de 0. La 
notation utilisee pour montrer que (0 T -©) converge par 
exemple en distribution vers une normale d’esperance nulle 

et de variance a 2 est la suivante: ^0 T -©j—>N(o,a 2 ). 

En resume, etablissons la structure hierarchique des modes de 
convergence. Elle s’etablit comme suit 4 : 


m.s. => p => d 
et a.s. => p 


Exceptionnellement, on peut observer: 

d=>p 


Concluons cette section en precisant qu’un estimateur sans biais 
n’est pas necessairement convergent. En effet, l’une des conditions 
pour la convergence en probability est que la variance asymptotique 
soit nulle. Supposons que 1’on ait le modele de regression suivant: 


y = c + e 


4. Voir a cet effet: Amemiya, T. (1985), Advanced Econometrics, Harvard University 
Press, Cambridge. 


© 2001 - Presses de l’Universite du Quebec 


fejiftrete Defat, 2875, Soul tamer, bamrn 450, Quebec,Cfafliec01V2M2-TO (418)657-439*)-www.pnq.ca 

Tirt: Traiti d'Ccammetrie fimmciire, Fransois-Eric Raotiot et Raymond Th6oret, ISBN 2-7605-1123-5 • Dli23N 




172 Traite d’econometrie financiere 


ou e est une variable aleatoire de moyenne nulle et de variance cons- 
tante et la correlation entre ses valeurs est constante et egale a p, ce 
qui peut se representer par: 


1 P P 
P 1 P 
P P 1 


P 

P 

P 


p p p . . . 1 

La matrice X est ici egale a un vecteur colonne dont toutes les com- 
posantes sont egales a 1, ce qui implique que 1’estimateur des MCO de 
c est y. En inserant ft dans la formule de la matrice variance-cova¬ 
riance de p, ici c, estime a partir du modele de regression generalise, 
on a: 


-f-(x T x)) 

[— (x T iix) 

|fi(x T x)T 

It' ') 

It 1 K 

l{ T X ') 


v (y)=Y (1_p+Tp) 


Si l’on prend la limite de cette expression, on obtient: pa 2 . Dans cet 
exemple, l’application des MCO en presence d’autocorrelation fournit 
un estimateur sans biais mais non convergent puis que la variance 
asymptotique n’est pas nulle. L’autocorrelation est en effet fort pro- 
noncee dans cet exemple. Dans les modeles de series temporelles, on 
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exige que la correlation entre les observations diminue au fur et a 
mesure que la distance entre celles-ci augmente. Ici, certe, cette 
condition est violee. 

1.2. Tests asymptotiques: LR, LM et Wald 

1.2.1. Test du ratio de vraisemblance: LR 

Le terme LR est l’abreviation anglaise de likelihood ratio. On veut 
tester l’hypothese HO: Rf> = r contre HI : R(3 ^ r . R est une matrice 
de dimension (q X k), ou q < k, et r est un vecteur de dimension 
(q X 1). De maniere a effectuer ce test, on doit obtenir la valeur 
estimee de la fonction de vraisemblance non contrainte: l|(3, a 2 j et 
sa valeur contrainte: l(|3 r , d| j. Le ratio de vraisemblance se definit 
comme suit: 


Intuitivement, on s’attend a rejeter l’hypothese nulle si X. est faible. Le 
test asymptotique general se formule comme suit: 

LR = -2lnX = 2[lnL(p,d 2 )-lnL(p R ,a|)]~x 2 (q) 


ou L(j3,6 2 j = (2ne) 2 (a 2 ) 2 =^-- -j (e T ej 2 =cstex(e T ej 2 . 

Le maximum de vraisemblance contraint est obtenu en maximisant la 
fonction suivante: 

l* = ^-u T (R|3-r) 
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ou u est un vecteur de dimension (q X 1) de multiplicateurs de 
Lagrange et £, le logarithme de la fonction de vraisemblance, c’est-a- 
dire: 


l = lnf(yi,y 2 ,...y n |x) = lnf(e 1 ,e 2 ,...,e n ) 

= - —ln2ji- —lna 2 -^ 7 (y-X(3) T (y-X(3) 

2 2 2a 2 

On peut montrer que (3 R est simplement le vecteur contraint obtenu 
des MCO satisfaisant 1’equation: R|3 r = r. Les residus qui en resul- 
tent sont les suivants: e R =y-X(3 R . Le MV contraint de cj 2 est: 
a R = e R e R /T. Par consequent, la fonction de vraisemblance est: 

T 

L (pR,6|) = cstex(e R e R ) 2 

En substituant l|(3 r , a R ) et L|p, a 2 ) dans LR, on obtient: 


LR = T(lne R e R -lne T e) = 
1 


) = Tlnfl + ^%^ 

V e T e 


= Tin 


Cette equation exige done d’estimer les modeles contraint et non 
contraint. On peut egalement considerer le test LR comme une trans¬ 
formation du test F: 


n 1H-XqF : 

L T-k J 


T 

T-k 


qF 
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1.2.2. Test de Wald 

Dans le test de Wald, seul le modele non contraint est estime alors 
que pour effectuer le test LR, il fallait estimer les modeles contraint et 
non contraint. Le test de Wald s’ecrit comme suit: 

(R|3 - r) T r(x t x) _1 R t 1 '(Rp-r) 

W =-!=-J- 

= T(e^e R -e T e 
e T e 

Dans la premiere egalite de cette expression, le vecteur |R[3 - r j nous 
indique si 1’estimateur du maximum de vraisemblance non contraint 
est rapproche ou eloigne de r, associe a l’hypothese nulle. Si |R|3 - r j 
est voisin de 0, cela implique que l’hypothese nulle ne sera pas rejetee. 
A l’oppose, si (R|3-rj est eleve, cela milite en faveur du rejet de 
l’hypothese nulle. 

Par ailleurs, on remarque dans la deuxieme egalite que les erreurs 
contraintes interviennent dans le test de Wald. Cela est attribuable a 

la relation suivante : e R e R -e T e = (R[3-rj |^R T (x T xj rJ 

|R(3 - r j. Par consequent, le test sur les contraintes peut etre effectue 
en faisant la regression non contrainte et en substituant la valeur de (3 
dans la premiere egalite. Altemativement, une regression contrainte 
peut etre estimee et le test portera sur la difference e R e R - e T e. [3 est 
asymptotiquement distribue comme une N^P,I '((3)j, ou I est la 
matrice d’information. Sous HO, R[3 - r est asymptotiquement distri¬ 
bue comme une loi normale multivariee de moyenne 0 et une matrice 
variance-covariance RL 1 ((3)R r , ou L'((3) = a 2 ^X r xj . Soit, en 
notation standard: |r( 3- r|~ n((),RI _i (p)R ' j. Elaborons davantage 
sur la matrice dite d’information. Cette matrice peut se calculer comme 
suit: 
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' (3^ 


—(x T x) 0 

1(0)=I 


= 

a 2 v ' 

T 


i^a 2 y 


0 - 

l 2a 4 ) 


Puisque cette matrice est diagonale, l’inverse de cette matrice est done 
de: 


I" 1 (0) = I“ 1 


r P ^ 


° 2 (x T x) 1 

A 

0 

y j 

- 

0 

2a 4 



V. 

T , 


Etant donne que cette matrice est diagonale, on peut se concentrer 
sur la partition reliee a (3 et ecrire que: 

(R|3-rj [RI _1 (p)R T J (R|3-rj~% 2 (q). La distribution asympto- 
tique vaut encore quand cr 2 est remplace par sa valeur estimee: 
e T e 

a 2 = - • II en resulte la statistique W presentee anterieurement: 

T 

(RP-r) T rR(x T x)"‘R T l ‘(Rp-r) 

W =-L--J-. 


1.2.3. Test LM 5 

Le test LM, aussi connu sous le nom de test score, se formule de la 
fagon suivante: 

lm = s T (ei ) i _ 1 (ei) s(ei.)‘ z 2 (q) 

ou 0 2 represente l’estimateur contraint et S(0), le vecteur score. A 
l’inverse du test de Wald, on n’a ici qu’a calculer l’estimateur con¬ 
traint. Le vecteur score: 


5. LM est l’abreviation anglaise de 1’expression Lagrange Multiplier Test. 
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' M ' 


-\x T e 

3(3 


a 2 



T e T e 

_da 2 _ 


_ _ o 2 " + 2o^_ 


evalue a 0 r , est obtenu en remplagant e par e R = y - X(3 R et a 2 par 



0 

Expliquons le calcul du deuxieme element de ce vecteur. En effet: 



En substituant ces calculs dans l’expression de LM, o 
di(X T X)" 0 
2a^ 
T 


e"X 


0 


"x T e R " 

s;x(x T x)" 

0 

a R 

Te R X 

(X T X)" 1 X T e„ 


e R e R 


obtient: 


6. Fournissons une interpretation intuitive de ce resultat qui a deja ete demontre. 
La matrice X(X’ l X- Hl X’ r effectue une projection dans l’espace des residus expli- 
ques. Le numerateur est done la somme des carres expliquee. En divisant cette 
somme par la somme des carres residuelle, on obtient R . 
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En termes de residus, la representation du test LM est de: 

eJe R -e T e 

Enfin, on peut montrer que les tests asymptotiques de Wald, du ratio 
de vraisemblance et du multiplicateur de Lagrange sont relies comme 
suit: W > LR > LM. Ces tests sont asymptotiquement equivalents, 
mais en general, ils different dans les petits echantillons. 


1.2.4. Variables instrumentales et estimation 


Dans cette section, on s’interesse au cas ou: 


plim 


— X T e*0. On 
T 


pense ici a une situation ou les X ne sont pas orthogonaux aux e, c’est- 
a-dire dans le cas ou, par exemple, les X sont stochastiques et sont 
correles avec les e. Pour traiter ce probleme, on recourt aux variables 
dites instrumentales. Supposons le modele de regression lineaire sui- 


vant: 


Y = X(3 + e 

ou Ton suppose que E(X T e) * 0. Une matrice de variables instrumen¬ 
tales Z se definit par les deux criteres suivants: i) les variables incluses 
dans Z sont a la limite non correlees avec les residus e, c’est-a-dire: 
1 T 

p lim — Z e = 0 ; ii) les variables incluses dans Z sont correlees avec 
T 

X et, a la limite: plim — Z T X = L zx , cette derniere matrice etant 
T 

finie et de plein rang 7 . L’estimateur des variables instrumentales IV 
s’obtient par la procedure suivante: i) on regresse d’abord X sur Z, 
d’ou on obtient: X = Z|3 = z(z T zj Z T X; ii) on regresse par la 
suite Y sur X. On obtient alors: P = (x ' xj X T Y. On peut ega- 
lement utiliser la notation suivante: P = Pjy = P 2 sls- e ff et > I’esti- 


7. C’est-a-dire qu’aucune ligne ou colonne n’est lineairement dependante des autres. 
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mateur des variables instrumentales est ici egal a l’estimateur des 
doubles moindres carres (2SLS: two-stage least squares), l’estimateur 
des doubles moindres carres s’obtenant en effet en appliquant les deux 
etapes precedentes. On elaborera davantage sur ces sujets dans le 
chapitre 11 consacre a la methode des moments generalises 8 . 


2. Problemes au chapitre des variables 

EXPLICATES : MULTICOLLINEARITE ET ENDOGENEITE 
DES VARIABLES EXPLICATIVES 

Multicollinearite 

Dans le modele de regression lineaire classique: y = X(3 + e, la 
multicollinearite parfaite signifie qu’il existe une relation lineaire entre 
les variables explicatives. Dans la pratique, la multicollinearite n’est 
pas parfaite. Elle presente cependant les consequences suivantes: i) la 
presence de collinearite au chapitre des variables de la matrice X, que 
l’on designe par multicollinearite, se traduit par une matrice (X T X), 
singuliere lorsque cette multicollinearite est parfaite, c’est-a-dire 

|x T x| = 0. II en resulte que (X r X) _l n’est pas definie. Dans la cas ou 
la multicollinearite est tres elevee sans etre parfaite, (X T X) _1 sera 
important, ce qui se traduira par une matrice de variances des MCO 
tres elevees; ii) la deuxieme consequence decoule de la premiere. En 
effet, si les ecarts-types des estimateurs @ sont eleves, les statistiques t 
seront faibles meme si les R 2 ou les F indiquent que l’ensemble des 
variables explicatives sont significatives; iii) les estimateurs pourront 
etre tres sensibles a l’ajout ou au retrait de variables explicatives 
apparemment sans signification; iv) on peut effectuer des previsions 
suffisamment precises en presence de multicollinearite si la collinearite 
entre les variables demeure stable. 

Pour identifier la multicollinearite, il existe plusieurs methodes. 
Nous en retenons deux. La plus simple consiste a calculer la matrice 
de correlation de Pearson. Cette matrice donne une mesure approxi¬ 
mative de la liaison lineaire entre les paires de variables explicatives. 


8. On trouvera un exemple d’application des variables instrumentales dans: Racicot, 
F.-E. (2000), op. tit., CRG 09-2000. 
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Le seuil a partir duquel la collinearite peut etre jugee importante 
s’etablit au voisinage de 0,8. La deuxieme methode pour juger de 
1’importance de la multicollinearite fait appel aux regressions auxi- 
liaires. L’avantage de cette methode sur la premiere est qu’elle permet 
d’exprimer une variable en fonction de plusieurs autres: 
x k = ajXj + a 2 x 2 +... + a k _ 1 x k _ 1 + v. Cette regression est dite auxiliaire 
car elle exprime une variable explicative a l’aide d’autres variables 
explicatives. Le terme v est une variable aleatoire appele difference. 
Une collinearite importante sera associee a une somme des carres 
residuelle faible ou a un R 2 eleve. 

Quelles sont les solutions possibles au probleme de multicolli¬ 
nearite? Nous en retenons quatre: i) on peut d’abord ajouter des 
variables explicatives de bonne qualite, mais celles-ci ne sont pas 
toujours disponibles; ii) on peut exclure les variables qui font pro¬ 
bleme si tant est que cela soit possible. Cette procedure equivaut a 
imposer des contraintes sur les parametres, mais nous avons vu ante- 
rieurement que si nous procedons de la sorte, les MCO sont biaises 
dans le cas ou les contraintes ne sont pas valables. Les MCO seront 
cependant sans biais dans le cas ou les contraintes sont valables; iii) si 
(X T X) est singuliere et que l’on a besoin d’inverser cette matrice, on 
peut utiliser l’inverse generalise de Moore-Penrose, aussi appele 
pseudo-inverse. Posons: Z = (X T X), une matrice carree, alors Z + est 
l’inverse generalise de Moore-Penrose. Cette matrice a la propriete 
d’etre unique et se definit comme suit: Z + = C^Aj'C^, ou Ai est la 
matrice diagonale qui renferme les valeurs propres ( eigenvalues ) de 
(X T X) non nulles, c’est-a-dire: 


X o . . . o 

0 \ 2 0 . 0 


0 o ... x k 
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et Ci est la matrice regroupant les vecteurs caracteristdques de (X T X). 

Pour fixer les idees, considerons un cas du calcul des valeurs 
propres et des vecteurs propres. Soit A et c, un vecteur dont les 
elements sont non nuls. On cherche a solutionner le systeme d’equa- 
tions suivant: (A - XI )c = 0 . Pour obtenir une solution non triviale a 
ce systeme, il faut que: | A - Xl| = 0 . On trouve les valeurs de X qui 
satisfont a la valeur de ce determinant. Une fois ces X calcules, on 
trouve le vecteur c a partir de la relation precedente: (A- Xl)c = 0. 
Pour illustrer ces calculs, considerons le cas d’une matrice A de di¬ 
mension (2 X 2). L’equation: (A - Xl)c = 0 peut alors se representer 
comme suit: 


a ll 

a 12 

Cl 


0 


a 22 -X 

c 2 


0 


Le determinant |A - Xl| = 0 est ici de: 

(a u -X)(a 22 -X)-(a 12 a 21 ) = 0. On appelle cette equation: l’equa¬ 
tion caracteristique. Le X est obtenu en solutionnant ce polynome du 
second degre, qui est de la forme: ax 2 + bx + c = 0. La solution est: 

-b± Vb 2 -4ac 
Xl ’ 2 _ 2a 

iv) la quatrieme solution pour traiter le probleme de multicollinearite 
consiste a utiliser l’estimateur de la ridge regression. Cet estimateur, 

designe par p r , est egal a: |3 r = (x T X + rDj X T y ou r est approxi- 
mativement egal a 0,01 et est obtenu par simulation et ou D est une 
matrice diagonale qui contient les elements de la diagonale de (X T X). 
L’esperance de cet estimateur est egal a: 

E|p r j = (x T X + rDj (x T x) (3, ce qui montre que l’estimateur de 
la ridge regression est biaise. Par contre, sa variance est inferieure a 
celle des MCO, c’est-a-dire: 

V(p r ) = a 2 (x T X + rD)“ 1 (x T x)(x T X + rD )" 1 < v(p). 
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Ici, l’intuition est la suivante. Lorsque l’on a multicollinearite quasi 
parfaite, le determinant de (X T X) est tres rapproche de 0. Le strata- 
geme est ici d’ajouter a la matrice (X T X) des elements de nature a 
rendre ce determinant different de 0, en l’occurrence rajouter rD a 
(X T X). On obtiendra ce faisant un estimateur biaise mais ayant une 
variance plus faible que les MCO, c’est-a-dire comportant un ecart 
quadratique moyen plus faible que les MCO, i.e.: 
EQM(p r )<EQM(p). 

Endogeneite des variables explicatives 

Pour presenter ce probleme, nous recourons au systeme d’equations 
de Pofffe et de la demande. On veut ici estimer la demande. Or, 
l’estimateur des MCO des parametres de la fonction de demande sera 
generalement biaise et non convergent. Les equations d’offfe et de 
demande sont representees a la figure 5.1. 



Le systeme d’equations d’offre et de demande s’exprime comme suit: 

qf =Pn+Pi2Pt+ e it (°) 

fit = P21 +P22Pt +e 2t (O) 
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On suppose que les innovations sont des bruits blancs. Sur la figure 5.1, 
l’equilibre se situe au point de jonction de l’offre et de la demande. A 
ce point, on a: 

fit = ‘It = fit 

En exprimant la demande sous sa forme inverse (appelee demande 
inverse ) et apres avoir remplace q c t ' par sa valeur d’equilibre q t , on 
obtient: 



Par consequent, une variation dans l’innovation en se repercute sur le 
prix (p,) et par ricochet, par l’intermediaire de la fonction d’offre, sur 
q t . Cela demontre que: 

E( Pt ,e lt )*0 

Par consequent, l’estimateur des MCO applique aux parametres de 
l’equation de demande est biaise et non convergent. La non-prise en 
compte de 1’ofFre se traduit ici par ce qu’on appelle un biais de 
simultaneite puisque la determination du prix et de la quantite corres- 
pondant a l’equilibre provient d’un systeme d’equations. Pour traiter 
ce probleme, on recourt generalement aux doubles moindres carres 
(2SLS) qui se traduisent par un estimateur convergent. En finance 
corporative, I’estimation de la demande et de l’offre d’obligations, qui 
donne lieu a la determination du taux d’interet d’equilibre du marche 
des obligations, est confrontee au meme probleme. II faut recourir a 
des variables instrumentales pour identifier ces deux fonctions. Ces 
fonctions decoulent surtout des travaux de Miller (1977) 9 . 


9. Miller, M. (1977), Debt and Taxes, Journal of Finance, mai, p. 261-276. 
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CHAPITRE 


6 

LES METHODES NUMERIQUES 
EN ECONOMETRIE 
UNE INTRODUCTION 


Dans ce chapitre, nous envisageons certaines techniques de simula¬ 
tion qui sont utilisees en econometric financiere pour generer des 
distributions, telles la simulation de Monte Carlo et la technique dite 
du bootstrapping. Ce chapitre s’attarde egalement sur une breve intro¬ 
duction au calcul stochastique dans ses rapports avec l’econometrie 
financiere. 


1. Simulation de Monte Carlo: 

LE CAS D # UNE OPTION ASIATIQUE 1 

Une simulation de Monte Carlo vise generalement a generer la distri¬ 
bution d’une variable economique ou financiere, du moins dans ses 
rapports avec la science economique et la theorie financiere. En eco¬ 
nometric, 1’input d’une simulation de Monte Carlo est generalement 
une distribution tandis qu’en finance, 1’input est generalement une 
equation differentielle stochastique discretisee. Le but est alors par 
exemple de calculer le prix theorique d’un instrument financier, telle 
une option, ou d’evaluer le risque theorique d’un portefeuille, par 
exemple lors d’une simulation de Monte Carlo qui met en cause la 
VaR 2 . 


1. Ce chapitre est base sur le cahier de recherche suivant: Racicot, F.E. et R. Theoret 
(2001), Les methodes numeriques en econometrie financiere. Analyse de quelques 
cas: La simulation de Monte Carlo, le bootstrap et le kernel, Document de 
travail du CRG, Ecole des sciences de la gestion, UQAM. 

2. VaR est l’acronyme anglais de Value at Risk. 
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Pour mieux comprendre la technique de la simulation de Monte 
Carlo, nous recourons a un cas, celui de la determination du prix 
d’une option de vente asiatique. Le prix d’exercice d’une telle option 
est la moyenne des prix de Paction sous-jacente du debut de la duree 
de Poption jusqu’a son echeance. L’expression generale du prix d’une 
option, comme d’ailleurs du prix de tout instrument financier, en 
termes de ses cash-flows est la suivante: 


Prix = e r P r P E* [Cash-flows(S)] 


ou r designe le taux sans risque; (T - t), le temps qu’il reste jusqu’a 
l’echeance de Poption; E*, l’esperance neutre au risque et Cash-flows, 
les cash-flows finaux de Poption selon les divers etats de la nature 
donnes ici par les prix probables de Paction sous-jacente. 

Avant de progresser davantage dans cette presentation de la 
simulation de Monte Carlo appliquee au calcul du prix d’une option 
asiatique, effectuons une courte digression 3 sur l’equation differen- 
tielle stochastique du prix d’une action dont nous nous servons ici 
pour construire notre simulation. Dans sa forme generale, cette equa¬ 
tion, appelee mouvement brownien geometrique, est la suivante: 


dS t =rS t dt + aS t dW t 


ou S designe le prix de Paction; dt designe la periode de temps; s est 
l’ecart-type du rendement de Paction; dW est un processus de Wiener 
d’esperance nulle et de variance dt. Pour en deduire Pequation du prix 
de Paction, soit S, divisons d’abord cette derniere equation par S et 
integrons cette equation de 0 a t: 



La premiere integrale est une integrale de Riemann standard egale a 
rt et la seconde integrale contient un terme aleatoire dW, mais son 
coefficient est constant dans le temps. Cette integrale peut done se 


3. Pour plus de details, voir: Neftci, S.N. (1996), An Introduction to the Mathematics 
of Financial Derivatives, Academic Press, New York; Wilmot, P. (1998), 
Derivatives: The Theory and Practice of Financial Engineering, John Wiley and 
Sons, New York; Briys, E. et al., (1998), Options, Futures and Exotic Derivatives, 
John Wiley and Sons, New York. 
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calculer de la fagon habituelle: o(W t -W 0 ) = oW t puisque Wo = 0. 
Par consequent, 


rtdS 

f —— = rt + a W r 

Jo s u 

Toute solution de cette integrale stochastique doit satisfaire cette 
integrale. En particulier, l’une des solutions est la solution suivante: 



Cette solution est fonction des parametres a, r et W t . On peut verifier 
l’exactitude de cette solution en differenciant cette derniere equation 
par le biais du lemme d’lto. Ouvrons ici une parenthese pour intro- 
duire ce lemme tres important en calcul stochastique. Supposons que 
la variable aleatoire x suive le processus d’lto suivant: 

dx = a(x,t)dt + b(x,t)dW 

ou W designe un processus de Wiener et a et b des fonctions de x et 
de t. La tendance {drift) de x est de a et sa variance est de b 2 . Soit une 
autre fonction de x et t designee par G. En vertu du lemme d’lto, la 
fonction G suit le processus suivant: 


dG = 



+ |dt + — bdW 

3t 2 dx 2 


ou dW designe le meme processus de Wiener que celui auquel obeit 
x. G suit egalement un processus d’lto. Son terme tendanciel est le 

contenu de la parenthese de dt et sa variance est - b 2 . Par 

Ux J 

exemple, supposons que S suive le processus suivant: 
dS = adt + bdW = uSdt + aSdW. Supposons que G = InS. En appli- 
quant le lemme d’lto, on a: 


dG = 



dt + adW 
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puisque -= — et s®-=-et-= 0. On peut montrer que 

as s as 2 s 2 at 

le lemme d’lto est au calcul stochastique ce qu’est 1’expansion de 
Taylor au calcul differentiel classique. 

On obtient, en appliquant le lemme d’lto a S qui, on le rappelle, est 


egal a: S t = S 0 e" 


dS t 




On retrouve alors l’equation differentielle initiale: dS t = rS t dt + 
(jS t dW t . Cette digression avait pour but de justifier la forme de 1’equa- 
tion du prix de I’action qui sert de base a la simulation de Monte 

ffr-V]t + aW t ] 

Carlo: S t =S 0 e^ v ' Comme S t suit une loi lognormale, 

lnS t suit une loi normale. Ce dernier est obtenu en prenant directe- 
ment le logarithme de la derniere equation, ecrite sous forme diffe- 
rentielle: 


dlnS t = 


-a 2 |dt + adW r 

2 J 


Cette equation participe de la nature des mouvements browniens 
generalises 4 . Cependant, avant d’enclencher la simulation de Monte 
Carlo, nous devons discretiser 5 cette equation. On peut a cet effet 
utiliser la methode d’Euler pour obtenir une discretisation du premier 
degre 6 . Pour y parvenir, discretions dans un premier temps 1’equa- 
tion differentielle qui sert de base a 1’equation du prix, soit: 


4. Un mouvement brownien generalise est de la forme: dX = udt + cdW alors 
qu’un mouvement brownien geometrique est de la forme : dX = uXdt + aXdW. 

5. Discretiser signifie convertir en temps discret une equation en temps continu. 

6. A remarquer qu’il existe des methodes d’approximation plus exactes comme celle 
de Milstein, qui est du second degre. Pour des eclaircissements sur ce sujet, voir: 
Jegadeesh, N. et B. Tuckman (2000), Advanced Fixed-Income Valuation Tools, 
Wiley, New York. 
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AS t = rS t At + aS t ^[At§ 


ou A represente une variation finie et 4> ~ N(0, 1). On discretise ega- 
lement sa solution, soit: 



Les developpements anterieurs avaient pour but de donner 
quelques fondements theoriques au cas de simulation de Monte Carlo 
qui nous interesse, soit la determination du prix d’une option de vente 
asiatique. Nous effectuons cette simulation en recourant au logiciel 
Excel. La methode de Monte Carlo consiste a generer des series de 
prix d’actions en utilisant la formule du prix d’une action qui vient 
d’etre derivee. Pour determiner la valeur du put asiatique, on calcule 
ensuite la moyenne des prix de Paction que 1’on retranche au prix 
d’exercice. Une serie est generee sur une periode de duree 1 par 
tranche de 0,01 periode (At). Chaque serie comporte done 100 periodes. 
Au bout de chacune de ces periodes, on calcule la moyenne de ces 
prix, que 1’on retranche au prix d’exercice. Pour les resultats, on con¬ 
sulted les colonnes moyenne et profit du chiffrier Excel qui apparait 
au tableau 6.1. 

Attardons-nous maintenant sur la technique du calcul d’une serie. 
Pour calculer le prix d’un put asiatique 7 , nous avons besoin des donnees 
suivantes. Le prix de depart de Paction sous-jacente au put asiatique 
est ici fixe a 80 et le prix d’exercice du put est de 85. Le terme ten- 
danciel 8 , soit r ou taux sans risque puisque l’on effectue une evaluation 
neutre au risque, est fixe a 5 %. La volatility du rendement de Faction 
sous-jacente au put asiatique s’etablit a 0,20 (20%). At est de 0,01. 
Calculons, pour la premiere simulation 9 , qui apparart au tableau 6.1 a 
la ligne SIM1 (t = 0,01), la formule qui nous sert a calculer l’evolution 
du prix de Faction par increment d’une periode a partir de son prix 


7. Void quelques references en frangais dans le domaine de la theorie des options: 
Khoury, N. et P. Laroche avec la collaboration de E. Briys etM. Crouhy (1990), 
Options et contrats a terme, Nathan; Khoury, N. et P. Laroche, Options et contrats 
a terme, 2 e edition, Presses de l’Universite Laval, Ste-Foy. 

8. Drift en anglais. 

9. 5 000 simulations similaires seront effectuees. Nous donnons ici un cas-type de 
simulation. 
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initial de 80. La formule mathematique utilisee a ete donnee prece- 

ff.VWs, 

demment, soit: S t+At =S t e vv 1 . En terme du langage 

d’Excel, elle s’ecrit: 

= E8*EXP(($B $10 - 0.5*($B $8 A 2))*$B$9 
+$B $8*($B $9 A (0.5))*(LOI.NORMALE.ST/\NDARD.TN\ 7 ERSE(ALEA0))) 

Tableau 6.1 


Simulation de Monte Carlo effectuee pour le calcul d'un put asiatique 
Programme par: Frangois-E. Racicot 


Temps t= t= 

P. Taction 80 Simulation 0 0.01 0.02 


Drift (u=r) 

0.05 Sim 


Volatility 

0.2 

1 

Increment 

0.01 delta t 

2 

Interet r 

0.05 

3 



4 

PV PUT 

5.19$ 

5 



6 

P.exercice 

85 

7 


8 

9 

10 
11 
12 

13 

14 

15 

16 

17 

18 

19 

20 
21 
22 

23 

24 

25 

26 

27 

28 

29 

30 


80 79.2891205 79.27126577 
80 78.66499431 81.95555147 
80 81.17816896 81.7754605 
80 79.25448317 81.57007378 
80 80.33680191 78.61477857 
80 78.31094261 78.56076837 
80 79.8205457 79.23789559 
80 80.82829744 79.19169645 
80 78.6009229 77.80161597 
80 79.85180274 79.96214356 
80 80.5444967 82.36397261 
80 82.41977267 82.92348779 
80 78.7899294 79.51720458 
80 82.94541457 83.96704888 
80 80.88513922 81.31031068 
80 81.86096848 83.49307978 
80 81.06315519 80.34279928 
80 78.69561097 77.63004399 
80 79.56165587 78.62794456 
80 79.62973861 81.73153194 
80 80.85553489 79.22527776 
80 76.24670934 78.53087555 
80 81.01945084 82.32192909 
80 80.0000912 78.49258051 
80 79.27836197 79.81361149 
80 81.47731027 80.59582096 
80 79.65430822 80.22714671 
80 80.67799503 79.62513833 
80 80.72992357 80.77637017 
80 80.38681647 79.93164664 
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ou le contenu des cellules est le suivant: E8 est le prix initial de 
Faction, soit 80; BIO, le taux d’interet sans risque (drift ); B8, l’ecart- 
type du rendement de Faction (a); B9, Fincrement periodique (At); 
ALEA, le generateur de variables aleatoires d’Excel. La fonction 
LOI.NORMALE.STANDARD.INVERSE0 exprime ALEA en une va- 
leur obeissant a une loi normale N(0,1). Pour ce qui concerne la 
premiere simulation, on copie la cellule dans les colonnes de 0,01 
jusqu’a 1. Rendu a 1, on ouvre une autre cellule (DC8 dans le cas de 
notre chiffrier) dans laquelle on calcule la moyenne des prix obtenus 
dans l’intervalle [0, 1]. La formule de DC8 est la suivante: 

=MOYENNE(E8 :DA8) 


t = 0.03 

t = 1 

Moyenne 

cash-flow 

Esperance 

80.85290647 

121.1143472 

96.52243117 

0 

5.4577 

80.48461538 

92.71114888 

76.75135139 

8.248648605 


80.49076078 

87.95487337 

83.61684531 

1.383154694 


79.62603839 

94.88866876 

78.89180296 

6.108197036 


74.29885889 

61.70866471 

73.06788345 

11.93211655 


81.2310313 

87.44423868 

77.69186473 

7.308135266 


77.63445005 

64.58821663 

76.93485993 

8.065140071 


78.26866563 

59.96705756 

64.53758041 

20.46241959 


79.38815434 

90.62379039 

81.72143152 

3.278568483 


79.37309059 

82.5227778 

75.06513338 

9.93486622 


84.87106345 

102.7100865 

90.46294143 

0 


85.01618452 

73.09447992 

83.18424521 

1.815754793 


78.54671554 

130.097093 

108.1235819 

0 


82.75009397 

61.4196164 

72.65938023 

12.34061977 


80.11606546 

96.81254171 

93.34845228 

0 


84.7212354 

120.8615132 

97.96073286 

0 


80.06404572 

78.51878392 

77.69767106 

7.302328944 


79.22190591 

70.70213568 

75.25370363 

9.746296368 


78.5616171 

62.461891 

71.48802002 

13.51197998 


81.82941669 

64.18020385 

69.87013862 

15.12986138 


78.17742773 

61.4891354 

74.121112 

10.878888 


80.27823954 

62.80009254 

69.24875683 

15.75124317 


80.93960323 

109.0163873 

94.25784774 

0 


76.39817994 

92.98605881 

84.8702347 

0.129765301 


81.01382557 

47.250664197 

65.34312409 

19.65687591 


82.14333057 

70.41452489 

76.38069633 

8.619303674 


81.46243778 

97.62815574 

100.1983943 

0 


81.40768541 

106.275939 

88.3070333 

0 


81.26770213 

61.93170253 

70.60894538 

14.39105462 


81.09882507 

82.88289369 

83.16753639 

1.832463614 
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On peut alors calculer le cash-flow final du put associe a la premiere 
simulation dans la cellule DD8, toujours dans notre chiffrier Excel, 
dont la formule est la suivante: 

=MAX($B $14-DC8,0) 

ou la cellule B14 contient le prix d’exercice. On reproduit cette simu¬ 
lation 5000 fois dans notre exemple. 

Finalement, on calcule 1’esperance risque-neutre (E*), qui, on le 
rappelle, est egale a: E* [Cash-flows(S)], s’exprime, dans le langage 
d’Excel: 

=SOMME(DD8:DD5007)/NB(DD8:DD5007). 

ou la colonne s’etirant de DD8 jusqu’a DD5007 renferme les cash¬ 
flows du put. Le resultat de cette operation apparait dans la cellule 
DG6 en ce qui conceme notre chiffrier. Pour obtenir le prix du put 
asiatique, il reste a actualiser 1’esperance E*, c’est-a-dire: 

=$DG$6*EXP(-$B $10*$DA$6) 

ou DA6 est la cellule qui renferme la periode 1, soit le temps terminal 
de chaque simulation. Ce resultat est reporte dans la cellule B12 qui 
nous fournit le prix du put asiatique, soit 5,24$. 

Dans l’exemple precedent, nous avons effectue 5000 simulations. 
Dans certains cas, ce nombre peut s’averer insuffisant. Par exemple, 
dans le cas de la discretisation d’Euler du modele de Cox, Ingersoll et 
Ross (1985) 10 servant a la modelisation de la structure a terme des taux 
d’interet, il peut etre requis d’effectuer jusqu’a 10 millions de simula¬ 
tions. En effet, 1’approximation cause deux types d’erreurs: 1’erreur sys- 
tematique et 1’erreur statistique. Plus precisement: e = e SY s + e stati 
ou e designe 1’erreur totale, esys, 1’erreur systematique et e STAT , 
1’erreur statistique. Dans le modele de Cox, Ingersoll et Ross, 1’erreur 
statistique ne se resorbe qu’au bout de 10 milhons de simulations. 
Cela donne a penser que 1’approximation d’Euler fait probleme et 
qu’il faudrait peut-etre recourir a des approximations de degres plus 
eleves que 1, telle 1’approximation deMilstein qui estune discretisation 
du second degre * 11 . 

10. Cox, J.C., J.E. Ingersoll et S.A. Ross (1985), « A Theory of Term Structure of 
Interest Rates », Econometrica, vol. 53. 

11. Pour plus de details, voir: Jegadeesh, N. et B. Tuckman (2000), Advanced Fixed- 
Income Valuation Tools, John Wiley and Sons, New York, chap. 13. 
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Mentionnons finalement que certains generateurs de variables 
aleatoires, telle la fonction ALEA d’Excel, finissent par reproduire les 
memes variables a partir d’un certain nombre de simulations. A titre 
d’exemple, si 1’on veut generer 1 million de variables aleatoires a partir 
de la version d’Excel 1995, il pourraity avoir jusqu’a 30 copies du meme 
ensemble de nombres aleatoires. Si l’on veut par exemple generer 
10 millions de nombres aleatoires, le logiciel Mathematica serait requis 
dans ce cas. II peut en effet generer 10 445 nombres aleatoires avant de 
se repeter 12 . Incideminent, pour le cas de devaluation du prix d’un 
titre, l’erreur de mesure decroit en proportion inverse de la racine 
carree du nombre (N) de simulations. Prenons par exemple le cas de 
la simulation du prix d’un produit derive designe par f par la methode 
de Monte Carlo. On peut alors construire l’intervalle de confiance de 
f qui nous donnera le nombre de simulations requises pour en arriver 
a une precision suffisamment elevee. Cet intervalle, au seuil de 95 %, 
est le suivant: 


1,96a r 1,96a 


ou p est la valeur estimee de f lors de la simulation et cr, 1’ecart-type 13 . 


2. La methode du bootstrap 

La methode du bootstrap est due a Efron (1979) 14 . Cette methode est 
tres apparentee a la simulation de Monte Carlo, mais elle a l’avantage 
de ne pas requerir de distribution a priori dans le mecanisme de 
generation des variables aleatoires. Nous avons deja mentionne que la 
mediane est un estimateur robuste de la tendance centrale alors que la 
moyenne ne l’est pas dans le cas d’une distribution non normale. 
Supposons que l’on ait un echantillon de depart X dont la distribution 
theorique est inconnue. La methode du bootstrap peut etre utilisee 


12. Bhansani, V. (1998), Pricing and Managing Exotic and Hybrid Options, McGraw- 
Hill, New York, chap. 5. 

13. Pour des informations additionnelles, voir: Hull J.C., (2000), Options, Futures 
and Other Derivatives, quatrieme edition, Prentice Hall, New Jersey, chap. 16. 

14. Efron, B. (1979), « Bootstrap Methods : Another Look at the Jacknife », Annals 
of Statistics, n° 7, p. 1-26. 
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pour generer certaines informations reliees a cette distribution. Par 
exemple 15 , la methode du bootstrap peut servir a calculer 1’ecart-type 
de la mediane de cet echantillon. Pour ce faire, on recourt a la formule 
suivante: 


a BOOT - 



ou ctboot designe l’ecart-type de la mediane; B, le nombre de simula¬ 


tions ; Mj, la mediane du nouvel echantillon; Mq 


1 B 
bS 


Mj, soit la 


moyenne des M ; decoulant des simulations. Attardons-nous a expli- 
quer la procedure du bootsrap pour le calcul de l’ecart-type de la 
mediane. 


i) La premiere etape consiste a generer un echantillon aleatoire 
Xj de taille n avec remise a partir de 1’echantillon initial, 
egalement de taille n. Toute observation de cet echantillon 
de nombre aleatoires comporte la meme probability d’occur- 
rence, soit 1/n. 

ii) La seconde etape revient a calculer la mediane pour 1’echan¬ 
tillon qui vient d’etre genere. 

iii) Et l’on repete ces deux etapes B fois. On peut alors calculer 
l’ecart-type de la mediane a partir de la formule pertinente. 

On peut generaliser cette procedure a toute statistique 0(y) calcu- 
lee a partir d’un echantillon y t (t = 1, ... n) dont on ne connait pas la 
distribution dans un petit echantillon 16 . L’operation bootstrap vise ici a 
approximer la distribution de cette statistique a partir de 1’echantillon 
des y observes. Pour ce faire, on doit tirer un nombre B d’echantillons 
de taille n. Cet echantillonnage est effectue avec remise. Certains de 
ces echantillons pourront contenir les memes observations plus d’une 
fois et les observations qui y apparaitront seront dans un ordre com- 


15. Nous nous inspirons ici de: Johnston, J. etj. Dinardo (1997), Econometric Methods, 
4 e edition, McGraw-Hill, New York, chap. 11. 

16. Nous nous inspirons ici de: Davidson, R. et J.G. McKinnon (1993), Estimation 
and Inference in Econometrics, Oxford University Press, New York, chap. 21. 
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pletement different de l’echantillon initial. On calcule 0(y*(i)) pour 
chacun de ces echantillons, ou i = 1, ... B. En bout de piste, on obtient 
ainsi B statistiques 0(y*(i)). On peut alors calculer toute statistique 
reliee a la distribution de 0(y), comme 1’ecart-type ou autres moments. 

On peut egalement illustrer la methode du bootstrap dans le cas 
d’un modele de regression lineaire 17 . Le but est ici de calculer l’espe- 
rance de (3. Soit le modele de regression lineaire suivant: 

y t =x t (3 + e t t = l,...,n 

Nous disposons d’un echantillon de depart pour les y et les x. On peut 
calculer le premier (3, designe par (3(1) a partir de ces observations. 
On effectue des bootstraps sur les y et x et a chaque fois on recalcule 
(3(i), i = 1,..., B. On peut alors calculer a partir de ces derniers l’espe- 

rance de |3, c’est-a-dire: Efp) = — ^P(i). 

B i=i 

Wilmott (1998) 18 donne un exemple de bootstrap applique a une 
serie de rendements d’actions. II dispose de 1000 rendements journa- 
liers sur chaque action. II reporte ces rendements dans un chiffrier. 
Les cellules sont numerotees de 1 a 1000, une pour chaque journee de 
l’echantillon et a chacune de ces journees sont associes les rendements 
des actions retenues pour cette journee. II effectue des tirages avec 
remise 1000 fois en utilisant une distribution uniforme. Cela constitue 
un premier scenario pour les rendements de son echantillon d’actions 
sur l’horizon d’investissement envisage. Et il refait ce processus autant 
de fois qu’il le faut pour generer une distribution precise des rende¬ 
ments futurs de son portefeuille d’actions. II peut alors calculer par 
exemple la VaR de son portefeuille, qui correspond a la perte maxi¬ 
male que peut subir celui-ci a un seuil de confiance generalement fixe 
a 95 % ou a 99 %. 


17. On peut egalement utiliser la methode du bootstrap dans le cadre du modele de 
regression non lineaire, mais celle-ci est alors tres intensive en calculs. 

18. Wilmott, P. (1998), Derivatives: The Theory and Practice of Financial Engineering, 
Wiley, New York, chap. 42. 
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3. Regression non parametrique : 

UNE SIMULATION MONTE CARLO 

Dans un chapitre precedent, nous avons presente les correlations non 
parametriques de Spearman et de Kendall. Pour poursuivre la discus¬ 
sion sur les methodes non parametriques, on peut montrer comment 
ces methodes peuvent s’appliquer au domaine de la regression. A cette 
fin, nous envisageons un cas base sur des observations generees par la 
simulation de Monte Carlo et mettant en cause la regression recou- 
rant aux kernels. 

Soit le modele de regression suivant: 


oh m(.) est une fonction arbitraire non Iineaire et e t , un terme d’erreur. 
II s’agit ici d’estimer m par la methode de regression non parametrique, 
le kernel. Dans les regressions du type kernel, la fonction de poids 
w t ,T(x) construite a partir de fonctions de densite de probability (pdf) 
k(x) et justement appelee kernel possede les proprietes suivantes: 


i) k(x) > 0 ; 



Et meme si le kernel ne joue aucun role sur le plan probabiliste 
dans l’analyse qui suit, on recourt a une fonction de densite connue 
pour determiner les ponderations comme le kernel gaussien qui est 
retenu dans le cas de notre exemple. Ce dernier a la forme suivante: 



II est a remarquer que nous avons ici effectue un changement d’echelle 
de la variable x en la reportant dans un intervalle h compris entre 
0,lxa x et 0,5xa x oh a x est l’ecart-type de {x t }. Notons que h est 
choisi de fagon a minimiser un critere: h = argmin h Q(h). Ce critere 
nous incite a choisir la valeur 0,1 xd x . La propriete ii) du kernel 
s’exprime, dans le cas de la transmutation d’echelle: Jk h (u)du = 1 
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1 M 

ouk h (u) = —k — . Definissons la fonctionde poids w t T(x) qui entre 

h yh) 

dans notre moyenne ponderee comme suit: 


k h( x_x t) 


1 T 

oh gh( x ) = -Lkh( x - x t)- 

1 t=i 

La technique de lissage des donnees de Nadaraya-Watson, 
l’estimateur kernel de m, se definit comme suit: 


T 

T E k h (x-x t )y t 

A h( x ) = -E w t,T( x )y t =^r - 

EM*”*.) 

t=l 

On remarquera dans cette formule que l’on effectue une moyenne 
ponderee des y t . Si h est tres petit, la moyenne sera calculee dans un 
voisinage tres concentre autour de x. Par ailleurs, quand l’intervalle 
est important, la moyenne sera calculee dans un voisinage plus etendu 
autour de x. h est done le parametre de lissage. 

Passons maintenant a un exemple programme dans le logiciel 
Excel. Dans un premier temps, nous generons les variables y a 
partir d’une simulation de Monte Carlo. Nous generons a cette fin 
200 variables y a partir de la relation suivante: 

y t = sin(x t ) + e t 

ou e t ~N(0, 1). Dans Excel, en faisant varier x t de 0 a 2tt, on ecrit: 

= SIN(B4) + LOI.NORMALE.STANDARD.INVERSE(ALEAO) 

et on copie cette cellule autant de fois qu’on le desire, 200 dans notre 
cas. Ce faisant, on obtient la variable y de notre simulation de Monte 
Carlo. La figure 6.1 reproduit les y obtenus par cette simulation: 
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On se sert ensuite de ces donnees pour calculer l’estimateur kernel 
obtenu, rappelons-le, a partir de la formule suivante: 
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j T £k h (x-x t )y t 

m h (x) = —^w tT (x)y t -. Incidemment, m h (x) 

t=1 £k h (x-x t ) 

t=i 

est l’estimateur de: E(y t |x t j = sin(x t ). Le resultat apparait a la 
figure 6.2. 

Pour generer kh(x - x t ) dans le logiciel Excel, on recourt a la 
formule suivante: 

=(1/$E$4*RACINE(2*PI0)))/(EXP((($F$2-B4) A 2)/(2*$E$4 A 2))) 

La cellule E4 renferme la valeur de h. Elle se calcule comme suit: 


=ECARTYPE(B4:B204)*0.1 

Les valeurs de x sont situees dans les cellules B4 a B204. Pour calculer 
m h (x), on recourt a la formule suivante: 

=SOMMEPROD(K4:K204;$C $4:$C$204)/NB(B4:B204) 

ou les cellules K4 a K204 renferment les valeurs de kh(.), et les cellules 
C4 a C204, les valeurs generees de y. 

Finalement, il faut dormer des valeurs a x pour le calcul de m h (x). 
Nous avons choisi les cinq valeurs suivantes programmees dans Excel: 
0, =PI()/2, =PI(), =3PI0/2, =2PI0- 

En finance, la regression kernel peut servir a estimer les betas des 
titres. Par exemple, si nous disposons des rendements mensuels, disons 
de IBM et du TSE300, on peut generer l’estimateur kernel du beta 
d’lBM. Les methodes non parametriques peuvent servir aussi a estimer 
des distributions empiriques et a effectuer des previsions 19 . A cet effet, 
Diebold et Nason appliquent les methodes non parametriques pour 
prevoir le taux de change 20 . 


19. Pour cette section, nous nous sommes referes aux documents suivants: Camp¬ 
bell, J.Y. et al. (1997), The Econometrics of Financial Markets, Princeton University 
Press; Oxley, L. et al. (1995), Surveys in Econometrics, Blackwell; Johnston et 
Dinardo (1997), op. cit, chap. 11. 

20. Diebold, F.X. et J.A. Nason (1990),« Nonparametric Exchange Rate Prediction ? », 
Journal of International Economics, 28, p. 315-332. 
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Figure 6.2 
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CHAPITRE 


7 

PHETEROSCEDASTICITE 


Dans ce chapitre, nous examinons d’abord comment la presence de 
l’hetoroscedasticite vient modifier les proprietes classiques des MCO. 
Puis nous envisageons les correctifs au probleme de Pheteroscedas¬ 
ticite, soit les estimateurs des moindres carres ponderes et des moindres 
carres generalises. Dans le cas pour lequel la matrice variance-covariance 
est inconnue, nous montrons comment on peut construire l’estimateur 
des moindres carres quasi generalises a partir de differentes formes 
d’heteroscedasticite en guise de correction de ce probleme. A cet effet, 
nous presentons la matrice de White pour traiter ledit probleme. 
Suivront les tests classiques pour circonscrire Pheteroscedasticite, soit 
les tests de Goldfeld et Quandt, de Breusch-Pagan, de White et un 
test general asymptotique. Finalement, nous presentons quelques 
applications. 


1. Proprietes de l # estimateur des MCO 

LORSQUE LES ERREURS SONT HETEROSCEDASTIQUES 

Le terme heteroscedasticite comporte les racines suivantes. D’abord « sce- 
dastique » est associe a « fonction scedastique », qui signifie « variance 
conditionnelle». La racine «hetero» fait reference a «plusieurs». 
Heteroscedasticite signifie done differentes variances. Bien que 
Pheteroscedasticite se retrouve a la fois dans les series en coupe instan- 
tanee et dans les series temporelles, nous n’etudierons dans ce cha¬ 
pitre que la premiere forme. La seconde sera abordee ulterieurement. 
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Precisons maintenant ce que nous entendons par heteroscedas- 
ticite. Soit le modele de regression lineaire suivant ne comportant 
qu’une seule variable explicative : 

Ft =Pl+p2 x t +e t 

ou E(e t ) = 0 et V(e t ) = o] = c? 2 x t . Analysons maintenant ces nou- 
velles hypotheses. Nous supposons done que les residus sont d’espe- 
rance nulle mais que la variance n’est pas fixe comme dans le cas 
homoscedastique mais bien variable. Elle varie ici en proportion di- 
recte de x t . En termes matriciels, la matrice variance-covariance s’ecrit: 


E(ee 1 ) = V = cr 


Xl 0 

0 x 2 


0 0 . . . x T 

Si on applique les MCO sur 1’equation ecrite plus haute, on obtient 
encore un estimateur sans biais, e’est-a-dire: E^pj = (3. Mais la va¬ 
riance de (3 est de: 


E [(M(|i))(M(|i)) T ] 

= 0 J (x T x)- , x T nx(x T x)- , « 2 (x T x)- 1 

Cela implique que les MCO sont inefficients en presence d’heterosce- 
dasticite puisque la variance des MCO est biaisee. Representons graphi- 
quement le phenomene de Pheteroscedasticite en reprenant Pexemple 
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de la relation entre les depenses sur cartes de credit et les revenus. 
Cette relation apparait a la figure 7.1. 


Figure 7.1 



ou y t designe les depenses sur cartes de credit et x t , les revenus. La 
figure 7.1 indique que la variance des depenses sur cartes de credit, 
circonscrite par le cone, augmente en fonction du revenu individuel. 
En effet, plus le revenu est eleve, plus les depenses font montre d’une 
dispersion importante en raison de la marge de manoeuvre plus elevee 
des gens riches. 

Comme 1’heteroscedasticite est ici de la forme: g 2 = a 2 x t et que 
l’on voudrait revenir a l’hypothese d’homoscedasticite, c’est-a-dire: 
E^e 2 j = a 2 , ce qu’il faut alors faire pour corriger ce probleme est de 


diviser e t par ^/x~ : V 


—V(e t ) = —o 2 x t = a 2 . On en deduit 

x t x t 
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que la solution au probleme de l’heteroscedasticite des erreurs est de 
corriger la regression par : 


}: +h Jt t + Jr, 


ou 


IID(o,a 2 ). 


On peut reecrire le modele corrige comme 


suit: 


y* t =Pi x *it+p2 x *2t+ e *t 

Et sous forme matricielle, ce modele s’ecrit comme suit: 

y* = X*(3 + e* 

ou e*~IID(0, cj 2 I). Si on applique les MCO sur cette regression, on 
obtient les moindres carres ponderes: 


PwLS=(x* T X*)"‘x*y* 

Les proprietes de cet estimateur sont les suivantes: 


e(Pwls) _ P 


^(Pwls) = ° 2 (X‘ T X*) 


ou l’estimateur de ct 2 est de: - e * T e *, oil k est ici de 2. 

T-K 
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2. L'ESTIMATEUR DES MOINDRES CARRES 
generalises: MCG 


Soit P la matrice diagonale de transformation des variables de la regres¬ 
sion : 

Xl 0 ... 0 1 
0 x 2 0 


y* = Py; X* = PX et P T P = 


0 0 


Puisque II -1 est diagonale, P est egal a l’inverse de la racine carree de 
la diagonale de O. Si l’on applique les MCO sur la regression trans- 
formee par P, on obtient l’estimateur des moindres carres generalises 
(MCG): 

Pgls = (x r n- 1 x)~ 1 X r n~ l y = (x r v~ l xy l X T V _1 y 
P GLS a la propriete d’etre 1’estimateur BLUE de (3. On a en effet les 

relations suivantes : e(| 3 gls ) = P; v(P G ls ) = (x T V _ 1 x) . La 

variance de e|p gls j = P est ici la variance minimale dans la classe des 
estimateurs lineaires. 

On a ici suppose que V est connu. Si V est inconnu, on peut 
l’estimer par V. On obtient ainsi les moindres carres quasi generalises 
(MCQG). Cet estimateur s’ecrit comme suit: 

j} = (x T V- 1 x)‘‘ X T V-‘y = [E 5 ' 21 ' 1 *' 
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ou x t est un vecteur de variables explicatives. 

Pour cet estimateur, u t 2 peut prendre un grand nombre de speci¬ 
fications. Par exemple, il peut etre egal a z'a ou encore a (z , 1 a) . 
Considerons par exemple le second cas. On a: 

o\ =(aj + a 2 x 2t +a 3 x 3t +... + a k x kt ) 2 ={z.Jaj 2 - Cette specification 

represente une forme lineaire d’heteroscedasticite qui depend des 
variables explicatives. Pour rendre operationnelle cette specification, 
nous devons calculer les residus estimes de la regression: y = X(3 + e 
et effectuer la regression suivante: 

|e t | = z^a + v t 

On estime cette regression par les MCO et l’on obtient les a du 
modele d’heteroscedasticite. On peut alors ecrire le modele d’hetero¬ 
scedasticite comme suit: 


Ayant postule cette forme d’heteroscedasticite, nous pouvons substi- 
tuer cette valeur dans l’estimateur des MCQG et obtenir: 

Cette technique est utilisee dans le cas ou plusieurs variables explica¬ 
tives sont susceptibles de causer l’heteroscedasticite. Donnons un 
exemple simplifie de cette technique de correction de l’heteroscedas¬ 
ticite. Soit le modele deja considere a deux variables explicatives qui 
relie les depenses sur cartes de credit aux revenus et aux revenus au 
carre. 



a t a t a t a t a t 

II reste a appliquer a cette equation les MCO pour obtenir les MCQG. 
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Notons ici deux proprietes des MCQG. D’abord, ils sont sans biais: 

E^P|X* j = (3. On ne peut determiner si cet estimateur est a variance 

minimale dans les petits echantillons parce qu’il est n’est guere pos¬ 
sible de calculer la matrice variance-covariance. Par contre, cet 

estimateur est convergent: plim^pj = (3. Ensuite, les proprietes 
asymptotiques de cet estimateur sont les memes que celles des MCG. 


3. Matrice de White pour l'heteroscedasticite 


Au vu des developpements precedents, la correction pour 1’heterosce- 
dasticite peut s’averer un processus ardu, ne serait-ce qu’en raison de 
la specification de la forme de l’heteroscedasticite. White (1980) 1 a 
propose un estimateur pour la matrice ecrite anterieurement: 

V(P) = a 2 (x T x)' 1 X T Ilx(x T x)' 1 . Cet estimateur a la forme sui- 
vante: 


V(P) = T(X-X)-S 0 (X-X)- 


ou S 0 



on x t est un vecteur de variables explicatives. 


Cet estimateur est pre-programme dans le logiciel EViews. En pra¬ 
tique, il suffira simplement d’estimer la regression lineaire: y = X(3 + e 
par la methode des MCO et de calculer la matrice de White de fagon 
a obtenir des ecarts-types corriges pour l’heteroscedasticite qui servi- 
ront a la construction des tests t corriges. Un exemple de cet estimateur 
sera fourni dans la section des applications 2 . 


1. White, H. (1980), «A Heteroscedasticity-Consistent Covariance Matrix 
Estimator and a Direct Test for Heteroscedasticity», Econometrica, vol. 48, 
p. 817-838. 

2. Notons que la transformation Box-Cox peut etre egalement utilisee pour traiter 
le probleme de l’heteroscedasticite. A cet effet, on consultera par exemple: 
Gaudry, M.J.I. et M.G. Dagenais (1979), «Heteroscedasticity and the Use of 
Box-Cox Transformations », Economics Letters, vol. 2, p. 225-229. 
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4. Tests d'heteroscedasticite 

Dans cette section seront presentes les tests de Goldfeld et Quandt, 
de Breusch-Pagan, un test general et finalement celui de White. 

4.1. Test de Goldgeld et Quandt (1965) 

Lorsque l’on peut identifier la variable a la source de 
l’heteroscedasticite, le test de Goldfeld et Quandt (GQ) est approprie. 
Soit le modele de regression lineaire suivant: y t = (3! +(3 2 x t +e t , ou 
e t ~N(0, CT t 2 ), (j t 2 = x t cj 2 . x t etant la cause de l’heteroscedasticite, on 
ordonne les observations par ordre decroissant des x t . On separe par 
la suite l’echantillon en trois partitions egales et l’on effectue la re¬ 
gression lineaire sur les partitions extremes, numerotees respective- 
ment 1 et 2. On obtient alors la variance des termes d’erreur de 
chacune de ces regressions, c’est-a-dire: 

~ 2 e l e l ~2 e 2 e 2 

a, =-et a t =- 

T, -2 “ T 2 -2 

ou k = 2 puisque, dans notre regression, nous avons deux parametres a 
estimer: le parametre du terme constant et celui de la variable expli¬ 
cative. Le test GQ s’ecrit comme suit: 

GQ = -77 ~ F(T x -k,T 2 -k) 

a; 

L’hypothese testee par GQ est la suivante: HO : of = g 2 versus HI : 
of > o 2 . Ce test est unilateral et il consiste a rejeter HO si F > F c pour 
un seul de confiance a de 5 %. La version bilaterale de ce test existe 
egalement et consiste aussi a ordonner les observations par ordre 
decroissant et a mettre au numerateur de F la variance estimee la plus 
elevee. Notons que la puissance du test depend du nombre d’observa- 
tions exclues 3 . 


3. II est a signaler que l’on peut egalement effectuer le test GQ en ordonnant les 
observations par ordre croissant de x t . La variance de la partition 2, qui est 
eventuellement la plus elevee, apparait alors au numerateur de F. 
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4.2. Test de Breusch-Pagan (1979) 


Dans la version presentee ci-devant, le test de Goldfeld-Quandt a 
pour defaut que la variable qui cause l’heteroscedasticite doit etre 
connue. Dans le cas ou la variance de 1’innovation depend de plus 
d’une variable explicative, le test de Breusch-Pagan (BP) s’avere plus 
approprie. Soit le modele de regression suivant: y t = x t r (3 + e t ou 

x t T = [1 X 2 t x 3 t ■ ■ • xkd et ou e t ~ N(0, cj t 2 ) et = h(z t ' a), a T , est un 
vecteur: a T = [ai a 2 ... aj. La fonction h(.) peut inclure toutes les 
variables explicatives. Cette formulation prend egalement en compte 
les differentes specifications suivantes. Une premiere specification est 
la forme multiplicative de l’heteroscedasticite due a Harvey (1976) 4 , 
qui est incidemment une forme tres flexible: 


Deux autres specifications de 1’heteroscedasticite sont les suivantes: 




Le test de BP vise a tester Phypothese suivante: HO: 

a T = [0 . . . 0] contre HI: a T ^ [0 . . . 0]. Si 

HO n’est pas rejetee, alors cr t 2 = ai, ce qui implique Phypothese d’ho- 
moscedasticite. Pour effectuer ce test, on n’a qu’a suivre la procedure 
suivante: 

i) Obtenir les residus estimes du modele: e = y - X|3 ; 

ii) Substituer e 2 a cT t 2 pour obtenir: 

ef = z 7 a + v t 

Ce type de regression est qualifie d 'auxiliaire ou d ’artificielle. 
Cette regression respecte le test BP puisque BP ne depend 


4. Harvey, A. (1976), « Estimating Regression Models with Multiplicative Hetero- 
scedasticity», Econometrica, vol. 44, p. 461-465. 
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pas de h(.). En appliquant les MCO sur cette regression, on 
obtient ainsi la somme des carres expliques (SCE): 
SCR 

SCE =-SCR = SCT - SCR. On calcule par la suite: 

1-R 2 




qui est incidemment l’estimateur maximum de 


T 

vraisemblance de ct 2 . 


iii) Calculer la statistique BP sous HO: a = 0. On a done: 


_ SCE 2 
BP = —t j ~X 2 | 
2d 4 


ou s est le nombre de variables incluses dans la regression artificielle, 
incluant le terme constant. On rejette HO si BP > x 2 c - 

Pour fixer les idees, dirigeons notre collimateur vers l’exemple 
suivant. On suppose que l’on a deux variables explicatives pour expli- 
quer y, y etant les depenses sur carte de credit de 1’individu i et les 
deux variables explicatives: le revenu et le revenu au carre de 1’indi¬ 
vidu i. En appliquant la procedure decrite precedemment, on suit les 
etapes suivantes pour implanter le test BP : 

i) On effectue la regression suivante: 


e 2 =a 1 +a 2 x 2 t +a 3 x 3 t +v t 

ii) On obtient la SCE de cette regression et on calcule egale- 
ment 6, tel qu’explique precedemment. 

iii) Sous 1’hypothese que les residus sont normalement distri- 
bues et sous HO: a 2 = a 3 = 0, on construit la statistique BP: 


BP = —— ~% 2 (s). On rejette HO, soit 1’hypothese d’homo- 
2d 4 

scedasticite, si BP > x 2 c . 


Si les residus ne sont pas distribues normalement, on recourt a la 
regression artificielle presentee precedemment et 1’on obtient le R 2 . 
On construit alors le test general asymptotique suivant: 


TR 2 ~% 2 (s) 
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Ce test fait partie de la classe des tests LM. Le test BP et le test 
general LM qui se confondent asymptotiquement sous l’hypothese de 
la non-normalite des residus sont des tests assez generaux, on le 
rappelle, pour integrer les formes d’heteroscedasticite non lineaire. 

4.3. Test de White (1980) 

Le test de White est un test general de 1’heteroscedasticite. Ce test 
recourt a la matrice de White exposee precedemment: 

v|pj = T^X ' xj S 0 (x'xj . II consiste a comparer cet estimateur 
a celui de la variance des moindres carres ordinaires. Sous l’hypothese 
d’homoscedasticite, l’estimateur de la variance des MCO est conver¬ 
gent tandis que sous l’hypothese d’heteroscedasticite, c’est l’estimateur 
de White qui l’est. Le test de White se fonde sur ce resultat. Ce test 
consiste comporte done les etapes suivantes: 

i) Effectuer la regression de e t 2 sur une constante et chaque 
variable de X®X. 

ii) Calculer TR 2 de cette regression et formuler le test: 

TR 2 ~% 2 (k -1), ou k est le nombre de regresseurs incluant 
la constante. 

iii) On rejette l’hypothese HO : a 2 = a 2 Vt contre HI : o 2 t ^ a 2 , 
si TR 2 > Xc- 

5. Applications 

Pour illustrer le probleme de l’heteroscedasticite dans les coupes ins- 
tantanees, nous allons revenir au modele des depenses sur cartes de 
credit en fonction du revenu de Pindividu i, de son revenu au carre, de 
son age et de la variable loyer-maison. Les resultats apparaissent au 
tableau 7.1. 
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Tart, fait 7.1 


Dependent Variable: CARTE 

Method: Least Squares 

Date: 04/13/00 Time: 18:09 

Sample: 1 100 IF X3 > 0 

Included observations: 72 

Variable 

Coefficient 

Std. Error 

t-Statistic 

Prob. 

C 

-237.1465 

199.3517 

-1.189589 

0.2384 

REVENU 

234.3470 

80.36595 

2.915999 

0.0048 

REVENU A 2 

-14.99684 

7.469337 

-2.007788 

0.0487 

AGE 

-3.081814 

5.514717 

-0.558835 

0.5781 

LOYERMAISON 

27.94091 

82.92232 

0.336953 

0.7372 

R-squared 

0.243578 

Mean dependent var 

262.5321 

Ajusted R-squared 

0.198418 

S.D. dependent var 

318.0468 

S.E. of regression 

284.7508 

Akaike info criterion 

14.20802 

Sum squared resid 

5432562. 

Schwarz criterion 

14.36612 

Log likelihood 

-506.4888 

F-statistic 


5.393722 

Durbin-Watson stat 

1.682310 

Prob(F-statistic) 

0.000795 


Le test de White 

La matrice X ® X qui est a la base de ce test comprend 13 variables, 
soit les variables initiales, les variables initiales elevees au carre et les 
produits croises des variables initiales. La regression suivante devra 
done etre effectuee: 

e 2 = (3j + (3 2 (age) + (3 3 (age) 2 + (3 4 (age x revenu) +... + v t 

A la suite de cette regression, on calcule le R 2 que l’on multiplie par 
le nombre d’observations et que l’on compare ensuite au Xc 2 , c’est-a- 
dire dans notre cas : 


TR 2 = 72 x 0,199 = 14,33 

Par ailleurs, le x 2 (12) est egal a 21,03 au seuil a = 5 %. Selon HO: 
a 2 =a 2 , soit l’hypothese d’homoscedasticite. Contrairement a nos 
attentes, 1’on ne peut ici rejeter l’hypothese HO, soit 1’absence 
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d’heteroscedasticite. Signalons que les tests de Breusch-Pagan et de 
Goldfeld et Quandt rejettent pour leur part HO, ce qui est conforme 
au graphique anterieur reliant les depenses sur cartes de credit au 
revenu individuel sur lequel il y avait apparence d’heteroscedasticite. 

Finalement, le tableau 7.2 presente les statistiques t corrigees 
construites a partir des ecarts-types de la matrice de White. 

Tableau 7.2 


Dependent Variable: CARTE 

Method: Least Squares 

Date: 04/13/00 Time: 18:12 

Sample: 1 100 IF X3 > 0 

Included observations: 72 

White Heteroskedasticity-Consistent Standard Errors & Covariance 

Variable 

Coefficient 

Std. Error 

t-Statistic 

Prob. 

C 

-237.1465 

220.7950 

-1.074058 

0.2866 

REVENU 

234.3470 

92.12260 

2.543860 

0.0133 

REVENU A 2 

-14.99684 

7.199027 

-2.083177 

0.0411 

LOYERMAISON 

27.94091 

95.56573 

0.292374 

0.7709 

AGE 

-3.081814 

3.422641 

-0.900420 

0.3711 

R-squared 

0.243578 

Mean dependent var 

262.5321 

Ajusted R-squared 

0.198418 

S.D. dependent var 

318.0468 

S.E. of regression 

284.7508 

Akaike info criterion 

14.20802 

Sum squared resid 

5432562. 

Schwarz criterion 

14.36612 

Log likelihood 

-506.4888 

F-statistic 


5.393722 

Durbin-Watson stat 

1.682310 

Prob(F-statistic) 

0.000795 


Pour obtenir ces resultats, il suffit d’utiliser l’option du logiciel Eviews 
permettant de calculer la matrice de White tout en effectuant une 
regression ordinaire pour obtenir les coefficients de regression. On 
ne remarque ici que peu de difference entre les statistiques t corrigees 
et non corrigees: apres correction, les variables non significatives 
demeurent non significatives et les variables significatives le demeurent. 


© 2001 - Presses de l’Universite du Quebec 

Edifice U Delta T.2W5, boul. limner, bureau 450, Quebec, Quebec G1V 2M2 • TCI (418) 657-4399 - www pug ca 

Tird : Traite d'econometrie financiere, Frangois-Eric Racicot et Raymond Thdoret, ISBN 2-7605-1123-5 • D1123N 








214 Traite d’econometrie financiere 


6. Note sur l'inference statistique 

EN PRESENCE D'HETEROSCEDASTICITE 

Les tests t et F de la regression corrigee ne sont pas valables, car on 
ignore la forme exacte de la matrice variance-covariance dans les 
petits echantillons. II faut se mefier du R 2 associe a cette regression. 
Ce R 2 tendra en effet a etre plus eleve apres regression, mais cette 
augmentation peut etre due au calcul de y* qui est utilise dans le calcul 
de ce R 2 . Qui plus est, ce R 2 n’est pas necessairement situe entre 0 et 
1, mais on peut remedier a cette situation en utilisant le R 2 corrige 
suivant: 


y-xPc: 


y-xp G 


E(y.-y ) 2 


ou X et y sont les variables originales. 
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CHAPITRE 


8 

^AUTOCORRELATION 
DES ERREURS RESIDUELLES 


L’autocorrelation des erreurs est un phenomene qui se retrouve dans 
le domaine des series temporelles. Un autre type plus rare de correla¬ 
tion des residus retrouve dans les coupes instantanees est appele cor¬ 
relation spatiale 1 . Nous allons cependant nous consacrer ici au premier 
type de correlation des residus. Nous envisagerons d’abord les pro- 
prietes de l’estimateur des MCO lorsque les residus sont autocorreles. 
Puis nous verrons comment on peut traiter ce probleme a partir des 
moindres carres generalises. 


1. Proprietes de l # estimateur des MCO 

LORSQUE LES RESIDUS SONT AUTOCORRELES 

II y a essentiellement deux causes classiques au phenomene de 1’auto- 
correlation. D’abord, 1’omission d’une variable pertinente au modele 
envisage ou 1’addition de variables inadequates peut causer l’autocor¬ 
relation. Ensuite, le traitement des donnees effectue par les agences 
statistiques pourrait se traduire par l’autocorrelation des erreurs resi- 
duelles lorsque l’on estime un modele. 

Considerons maintenant un modele de regression lineaire appli¬ 
que a des series temporelles. Ce modele s’ecrit: 

y t = x7(3 + e t 


1. Voir a cet effet: Racicot, F.-E. (2000), Notes on Nonlinear Dynamics, CRG, op. cit. 
On consultera aussi: Jonhston, J. (1988), Me'thodes econometriques, tome 2, 
Economica, Paris. 
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ou t represente le temps. Nous introduisons ici une modification au 
processus suivi par l’innovation par rapport au modele classique. En 
effet, on postule que e t suit un processus autoregressif d’ordre p, 
designe par AR(p). Nous nous limiterons dans cette section au pro¬ 
cessus autoregressif d’ordre 1, c’est-a-dire: p = 1. Ce processus sto- 
chastique se definit ainsi: 


e t = pe,.^ +e t 

ou e t est un bruit blanc (white noise) et ou |p|<l. Considerons 
d’abord certains aspects du processus AR(1) avant de nous deplacer 
vers les proprietes de 1’estimateur MCO comme tel en presence d’auto- 
correlation. 

Dans le processus AR(1), nous avons postule que e t est un bruit 
blanc. Cela signifie que : 

E(e t ) = 0 

V( e r) = <T e 

Cov(e t ,e s ) = 0 V t,s 

Avoir suppose que | p | < 1 implique que le processus stochastique de e t 
est stationnaire. La stationnarite d’une serie signifie entre autres que 
sa moyenne et sa variance sont constantes et que l’autocovariance ne 
depend que de la distance entre les realisations. Nous reconsidererons 
plus en details ces allegations dans le prochain chapitre. 

Pour degager les proprietes de 1’estimateur des MCO en pre¬ 
sence d’autocorrelation, ecrivons un modele simple qui ne renferme 
qu’une seule variable explicative, soit: 

y t =(3i+(3 2 x 2t +e t t = 1,..., T 

ou e t suit un processus AR(1). La matrice variance-covariance des 
residus se presente comme suit: 


© 2001 - Presses de l’Universite du Quebec 

Edifice U Delta 1,2&T5, boat limner, bureau 450, Quebec, Quebec G1V 2M2 • TCI (418) 657-4399 - www pug ca 

Tird : Traite d'econometrie financiere, Frangois-Eric Racicot et Raymond Thdoret, ISBN 2-7605-1123-5 • D1123N 



^autocorrelation des erreurs residuelles 217 


1 p p 2 . . p T 1 

P 1 p . . p T ~ 2 


E ee 1 =V = a a = a 


1-P 


1 


Voyons comment se calculent l’tm des elements de la diagonale prin- 
cipale et un autre hors-diagonale. Les elements sur la diagonale sont 
les variances de e t . On a: 

V(e t ) = V(pe t _ 1 + e t ) = p 2 V(e t _!) + V(e t ) 

puisque Cov(e t _ 1 ,e t ) = 0. Comme nous avons suppose que le pro¬ 
cessus est stationnaire, on a: 


V(e t ) = p 2 V(e t ) + a 2 

-V(e t ) = ^L = cS 

1-P 

Pour obtenir les elements hors-diagonale, nous avons calcule l’auto- 
covariance qui est requise pour le calcul de ^autocorrelation. 

Cov(e t ,e t _ 1 ) = E[(e t -E(e t ))(e t _ 1 -Efe^))] = E(e t e t _!) 

= E((pe t _ 1 + e t )e t _ 1 ) = pE(e t _ 1 ) 2 + E(e t e t _!) = pa 2 = p ° E 

1-p- 
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II en resulte la formule suivante pour ^autocorrelation: 


Corr(e t ,e t _ 1 ) = 


Cov(e t ,e t _ 1 ) 

V(e.) 



Par consequent, r represente la correlation entre l’erreur d’une periode 
a l’autre et est done designe: coefficient d’autocorrelation. Par ailleurs, 
l’autocovariance entre e t et e t -k est egale a: p k u e 2 et est obtenue par 
substitutions repetees. On peut done ecrire : 

Corr(e t ,e t _ k ) = p k 

pour k = 1, 2, .... 

Par rapport au modele classique des MCO, la matrice variance- 
covariance des residus n’est plus egale a cj 2 I mais a crfil. Comme dans 
le cas de l’heteroscedasticite, en presence d’autocorrelation, l’estima- 
teur des MCO de (3 est sans biais, e’est-a-dire: E|pj = (3. Mais cet 
estimateur est inefficient puisque la variance de [3 qui decoule de 

l’estimateur des MCO est egale a: a 2 (x T x) X T nx(x T x) , ce 

qui est certes different de cr(x T xj . La variance donnee par les 
MCO comporte done un biais, d’ou l’inefficience de cet estimateur. 

Revenons au modele simple a une variable ou le terme d’erreur 
suit un processus AR(1). Nous voulons demontrer comment traiter le 
probleme d’autocorrelation dans ce cas. Substituons la valeur de e t 
dans ce modele. Nous avons: 


y t =$! +(3 2 x 2t +pe t _j +e t 

ou e t _j = y t _! - Pj - (3 2 x 2 t _ 1 . En remplagant e t _i par sa valeur, on a: 

y t - py t-i = Pi f 1 - p) + P2 ( x 2t - P x 2 )t -i)+ e t 

Une telle transformation est appelee: transformation en quasi-differences. 
Un telle equation peut etre estimee en recourant aux moindres carres 
non lineaires. En effectuant les regroupements suivants, cette der- 
niere s’ecrit: 


y * t = (3 1 x* lt +(3 2 x* 2t +e t t = 2,3,...,T 
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ou e t est un bruit blanc. Si on applique les MCO sur ce dernier 
modele, on obtient un estimateur BLUE pour p quand p est connu. 
Par contre, deux problemes subsistent. En premier lieu, la transfor¬ 
mation en quasi-differences se traduit par une perte d’information, en 
l’occurrence yi* et X 21 * . En deuxieme, la valeur de p n’est generale- 
ment pas connue. Pour pallier a ce dernier probleme, Cochrane et 
Orcutt (1949) 2 ont suggere la procedure iterative suivante qui fait 
litiere de la premiere observation. Soit les deux equations: 

yt - Pyt-i = Pi (l - P) + P2 ( x 2t - P x 2,t-i) + e t 
y t - Pi - P2 x 2t = p(y t -i - Pi - P2 x 2, t -i) + e t 

La premiere etape de la procedure iterative consiste a postuler une 
valeur initiale hypothetique pour p, designee par p^\. On obtient les 
valeurs: yt _ P(i)yt-l et x 2t -P(i) x 2 , t -i 9 ue l’ on substitue dans la 
premiere equation . On applique les MCO sur cette equation et 1’on 
obtient: et P 2 (i) ■ Ceci constitue la premiere etape de 1’iteration. 

Dans une deuxieme iteration, on substitue ces deux coefficients dans 
la deuxieme equation et l’on obtient, en appliquant les MCO, une 
seconde valeur de p, designee par m 2 \. Le processus iteratif se termine 
quand on note la convergence, e’est-a-dire quand les coefficients 
estimes ne varient plus sensiblement d’une regression a l’autre. Comme 
cette methode neglige la premiere observation, elle peut dormer lieu a 
des estimateurs relativement inefficients dans les echantillons restreints. 
Ce probleme tend a s’estomper a mesure que la taille de l’echantillon 
augmente. 

Prais et Winsten (1954) ont propose de prendre en compte la 
premiere observation en utilisant la procedure suivante. On calcule 
comme suit la premiere observation: 


2. En presence d’erreurs de mesure sur les variables, la procedure de Cochrane et 
Orcutt et celle de Prais et Winsten pourraient s’averer perverses, en ce sens 
qu’elles amplifieraient les prolemes causes par les erreurs de mesure. Pour plus 
de details, voir: Dagenais, M.G. (1994), «Parameter Estimation in Regression 
Models with Errors in the Variables and Autocorrelated Disturbances », Journal 
of Econometrics, vol. 64, p. 145-163. 
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En transposant le tout sous forme matricielle, on obtdent: 

y* = X*(3 + e 


V 1_ p 2 yi 

yz-pyi 


y T -py T _, 

-Jl-P 2 e 



a/ 1- P 2 a/ 1 -P 2x 21 


1-p x 22 -px 21 

= Py X* = 



1-p x 2T _ P X 2,T-1_ 
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Vi-p 2 0 . . . 0 

-p 1 0 . . 0 

0 -p 1 0 . 0 


0 


P ^ -TxT 


En appliquant les MCO sur les variables transformees par P, on 
obtient 1’estimateur BLUE de 0: 

p = (X* T X*) _1 X* T y* = (X T P T PX) _1 X T P T Py 

= (x T n- | x)" 1 x T n-' y = PGLs 

ou fi 1 = P T P. On est ici en presence de 1’estimateur des moindres 
carres generalises pour un r donne. La variance de cet estimateur est de: 

v(p GLS ) = ^(x T ft- 1 x )" 1 

Dans cette equation, on estime o 2 e par: 

(y*-x*p GLS ) T (y*-x*j 5 GLS ) 

Gp = ---—--- ou k = 2 pour le cas qui nous 

T-k 

interesse. 

En resume, si p est connu, en remplagant y, X et e par y*, X* et 
e* dans le modele ci-haut presente et en appliquant les MCO sur le 
modele ainsi transforme, on obtient 1’estimateur des moindres carres 
generalises, qui est 1’estimateur BLUE de 0. Quant a eux, les tests 
d’hypotheses et les intervalles de confiance valent toujours tant et 


© 2001 - Presses de l’Universite du Quebec 

Edifice Delta 1,2&T5, boat I.aoner, bureau 450, Quebec, Quebec G1V 2M2 • TCI (418) 657-4399 - www pug ca 

Tird : Traite d'econometrie financiere, Frangois-Eric Racicot et Raymond Thdoret, ISBN 2-7605-1123-5 • D1123N 






222 Traite d’econometrie financiere 


aussi longtemps que les estimateurs MCG de (3 et de a 2 e sont utilises. 
Par contre, si p est inconnu et estime, alors les tests ne sont valables 
qu’asymptotiquement. Le R 2 souffire du meme probleme que dans le 
cas de 1’heteroscedasticite. Apres correction pour ^autocorrelation, le 
R 2 tendra a diminuer. La procedure proposee pour corriger ce pro¬ 
bleme est la meme que celle etablie dans le cas du probleme de 
1’heteroscedasticite, qui, on le rappelle, est de calculer le R 2 comme 
suit: 


2 _ (y-xp GLS ) T (y-xp GLS ) 

R GLS - 1 T- 

L(y.-y ) 2 

ou y et X sont les variables non transformees. 


2. Correction du modele original 

LORSQUE p N'EST PAS CONNU 

Tel que mentionne, la methode Cochrane-Orcut est un algorithme 
iteratif pour determiner la valeur des parametres du modele de regres¬ 
sion avec autocorrelation. La methode de Prais et Winsten, quant a 
elle, tient compte de la premiere observation. Une fagon d’enclencher 
l’algorithme est de prendre comme p initial celui qui resulte de la 
regression suivante: 

e t = pe t -i+^t 

L’estimateur de p, biaise mais convergent, est donne par: 


T 

t=2 



qui est le coefficient d’autocorrelation estime entre e t et e t _i. Bien 
qu’il soit preferable de se servir de cet estime comme point de depart 
a l’algorithme iteratif Cochrane-Orcut, de fagon a simplifier l’expose, 
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nous substituons directement cette valeur dans la formule des MCG 
de maniere a obtenir les moindres carres quasi generalises (MCQG) 3 , 
ce qui est une procedure qui est egalement acceptable. On obtient: 

^Mc Q G = (x T ii- 1 x)" 1 x T a- 1 y 

ou (x T a~ 1 x) et ou Pestimateur de 0 ^ est: 

^y*-X*P MCQG j jV*-X*P MCQG j 

° E_ T-k 


Procedures recentes pour la correction 
de ('autocorrelation 

Comme nous l’avons mentionne anterieurement, le modele de regres¬ 
sion classique peut s’ecrire comme suit en presence d’autocorrelation: 

y t = (! -p)Pi + pyt-1 + P2 x 2t - Pp2 x 2,t-1 + e t t = 2, 3,T 

Cette equation contient des produits de parametres, ce qui implique 
qu’elle est non lineaire. On peut done recourir aux moindres carres 
non lineaires (NLS) pour estimer cette equation: 

Min S*(P 1 ,P 2 ,p) = Min £ (y t -(l-p)Pj -py t _j -|3 2 x 2t +p|3 2 x 2|t _ 1 ) 2 

P1.P2.P Pl.P2.P t=2 

Cet estimateur, on le rappelle, ne comporte pas de solution analytique. 
Pour estimer les parametres, on aura recours a l’algorithme d’optimi- 
sation dont il fut question dans la section des moindres carres non 
lineaires. Si les residus sont normalement distribues, Pestimateur des 
moindres carres non lineaires se confondra avec celui du maximum de 
vraisemblance. Sa performance equivaudra alors a celle des FGLS. 


3. Soit les FGLS en anglais, ce qui est Pabreviation de -.Feasible Generalized Least 
Squares. 
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La methode d’integration de la premiere observation developpee 
par Prais et Winsten peut etre incorporee dans le modele de regres¬ 
sion non lineaire. On obtient alors : 

S(Pi jP 2jP ) = S*((3 1 ,(3 2 ,p) + (e* 1 ) 2 

ou (e*i) =(y*i -(3 1 x* 11 -(3 2 x* 21 ) 2 . Pour determiner la valeur des 
parametres, on minimise la fonction S en ayant recours a l’algorithme 
d’optimisation. Dans les cas ou le terme d’erreur suit un processus 
AR(p), il existe une procedure en deux etapes pour corriger l’auto- 
correlation. 


3. Tests d'autocorrelation 

Pour detecter la presence d’autocorrelation d’ordre 1, le test Durbin- 
Watson (1951) demeure le plus populaire. La statistique associee a ce 
test est: 



T 

E s < 2 

t=i 


Pour comprendre pourquoi d est une statistique pertinente pour 
tester l’autocorrelation, on reecrit d comme suit: 

j E ^ 2 

E s ? 

En eclatant cette somme en ses composantes, on a: 

T T T 

£e? y^e^ y^eje^ 

d = + i ^--= l + l-2p = 2(l-p) 

E=; E s ? E j2 
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Si p = 0, il en resulte done que d est environ egal a 2 et si p = 1, d est 
approximativement egal a 0. Le calcul de la statistique d nous indique 
done si les residus sont autocorreles ou non. II reste que cette demarche 
s’avere plus ou moins rigoureuse. 

La procedure classique pour tester la presence d’autocorrelation 
est la suivante. 

i) Soit d u la borne superieure du test et dL, la borne inferieure, 

le test comportant en effet deux homes. Soit HO: p = 0 et 

HI: p^O. On a les cas suivants : 

a) d u < d < 4 - d u —» ne pas rejeter HO ; 

b) 0 < d < d L -> rejeter HO => p > 0 ; 

c) 4-d L <d<4-> rejeter HO => p < 0; 

d) d L < d < d u ou 4 - d u < d < 4 - d L ->zone d’indetermination 

II faut cependant remarquer que dans le cas ou la regression 
comporte, parmi les variables expheatives, la variable dependante retar- 
dee (y t -i) et que les residus sont autocorreles d’ordre 1, la statistique 
d est alors biaisee vers 2. Elle ne peut done etre utilisee directement 
pour tester 1’autocorrelation. La statistique h developpee par Durbin 
(1970) doit alors etre utilisee. Celle-ci se definit alors comme suit: 

1|I-TV(P 2 ) 

ou p est le coefficient d’autocorrelation du processus AR(1) calcule a 
l’aide des residus des MCO et v((3 2 ) est l’estime de la variance du 
coefficient de y t _i. Sous HO, la distribution de h est de: h i N(0,1). 
Si l’on detecte de 1’autocorrelation en presence d’une variable depen¬ 
dante retardee, l’estimateur des MCO est alors biaise et non conver¬ 
gent : le terme d’erreur n’est pas dans ce cas ortbogonal a y t _i. II faut 
alors recourir a d’autres methodes pour estimer une telle regression 4 . 


4. Pour plus de details, on consultera: Judge, G.G. et al., (1985), The Theory and 
Practice of Econometrics, John Wiley and Sons, New York. 
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4. Prevision dans le modele lineaire 

AVEC ERREUR DE LA FORME AR(1) 

Dans les chapitres precedents, nous avons etudie comment prevoir a 
1’interieur du modele lineaire. Nous suivons la meme procedure ici en 
venant toutefois nous situer dans le domaine temporel. Quand les 
residus sont autocorreles, l’estimateur des MCO de yo, designe par 
y 0 , souffire d’inefficience. On recourra alors aux moindres carres 
generalises (MCQG). Pour fixer les idees, reprenons le modele lineaire 
de base: 


y t =x7(3 + e t , t = 1,T 

ou e t = pe,.^ +e t , ou e t ~ WN|o, g 2 e j et ou | p | < 1, soit l’hypothese 
de stationnarite. Si l’on veut predire yr+i, on peut ecrire: 

y T +l = x T+lP + P e T + e T+l 

Pour obtenir la prevision, on substitue Pmcqg a P, p a p et e T a ex- 
On trouve e T comme suit: 

e T = y T _x tPmcqg 
On degage la prevision suivante de yT+i: 

Yt+i = x t+iPmcqg +P^t 

pe T tenant lieu de prevision de eT+i, qui incidemment n’est valable 
qu’asymptotiquement. 

Si l’on desire effectuer une prevision plusieurs periodes a l’avance, 
par exemple h periodes, on precede de la fagon suivante. II faut pour 
ce faire calculer 1’esperance conditionnelle du terme d’erreur du 
modele, qui est egale a: 

^T+h = Et ( e T+h) = P he T + P h ( £ t+i ) + ••• + E t (e T+h ) 

Cette equation est obtenue par substitutions repetees. Comme l’espe- 
rance des E r+j est egale a 0, on obtient la prevision de yT+h qui est de: 

YT+h = E T (yT+h) = x t+1iPmcqg +P h ^T 
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La variance de cette prevision(o^ K ), qui vaut asymptotiquement, se 
calcule comme suit: 


sir =aj+fe^h 2 p !(h_l) /T') 


oil: 

=de[(l-p 2 h )/(l-p 2 )] + de(x T+h -p h x x ) T (x r Q.~ l x) 1 (x x+h -p h x x ) 


5. Applications 


Nous recourons de nouveau au modele de Pimpact des jours de la 
semaine sur les indices boursiers que nous avons introduit dans la 
section sur les variables auxiliaires. Nos resultats sont compiles au 
tableau 8.1. 


Tart,fait 8.1 


LS // Dependent Variable is LOG(SP50072/SP50072(-1))*100 

Date: 12/13/99 Time: 21:54 

Sample(ajusted): 2 503 

Indued observations: 502 after adjusting endpoints 

Variable 

Coefficient 

Std. Error 

t-Statistic 

Prob. 

C 

0.043659 

0.080335 

0.543455 

0.5871 

M72 

-0.319821 

0.117947 

-2.711565 

0.0069 

T72 

0.028880 

0.114167 

0.252962 

0.8004 

TH72 

0.015556 

0.113887 

0.136589 

0.8914 

F72 

-0.017636 

0.113887 

-0.154857 

0.8770 

R-squared 

0.023408 

Mean dependent var 

-0.008239 

Ajusted R-squared 

0.015548 

S.D. dependent var 

0.825708 

S.E. of regression 

0.819264 

Akaike info criterion 

-0.388788 

Sum squared resid 

333.5829 

Schwarz criterion 

-0.346770 

Log likelihood 

-609.7212 

F-statistic 


2.978156 

Durbin-Watson stat 

1.562695 

Prob(F-statistic) 

0.018937 
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La statistique Durbin-Watson (d) est de 1,56, ce qui, en vertu 
des tables qui apparaissent a la fin de ce volume, donne lieu au rejet de 
l’hypothese HO (absence d’autocorrelation). d est en effet inferieur a 
dL qui est de 1,73 pour un nombre de degres de liberte k’ 5 = 4, c’est- 
a-dire 4 variables explicatives excluant la constante, au niveau de 
confiance de 5 % et pour un nombre d’observations (T) de 200. Cette 
conclusion vaut toujours si nous excluons les variables qui ne sont pas 
significatives dans le tableau 8.1. Dans le logiciel EViews, il est sug- 
gere une procedure simple de correction du probleme d’autocorre¬ 
lation, a savoir rajouter a la regression la variable dependante retardee 
et reestimer le modele. On verifie alors, par le biais de la statistique h, 
s’il y a encore autocorrelation, tout en tenant compte du probleme qui 
se cree s’il y a autocorrelation. S’il n’y a pas autocorrelation, on con¬ 
serve alors la variable dependante retardee comme variable explicative 
du modele. 


5. Nous mettons un’ak car le test exclut la constante du modele. 
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CHAPITRE 


9 

LES SERIES TEMPORELLES 


La modelisation des series chronologiques vise la prevision a court 
terme sans s’interesser au caractere structurel des modeles econo- 
miques et financiers, c’est-a-dire les modeles qui expliquent le com- 
portement des variables economiques et financieres. La modelisation 
vise simplement le data-fitting, c’est-a-dire l’ajustement d’une serie a 
ses propres observations de fagon a maximiser la vraisemblance de cet 
echantillon. La modelisation en series temporelles remonte a l’etude 
publiee par Box et Jenkins 1 en 1976. Bien que les econometres aient 
alors accueilli cet ouvrage avec une certaine froideur, les techniques 
reliees aux series temporelles ont par la suite envahi le champ de 
l’econometrie financiere. L’ouvrage de Hamilton 2 (1994) prend acte 
de la complexity qu’a atteint cette branche de l’econometrie. 


1. Processus stochastiques 

Un processus stochastique est une suite de variables aleatoires definie 
sur un meme espace W, appele espace fondamental ou espace des etats de 
la nature. Un processus stochastique se formule comme suit: 

y = (y t ,teN) 


1. Box, G.E.P. et G.M. Jenkins (1976), Time Series Analysis: Forecasting and Control, 
Holden-Day, San Francisco. 

2. Hamilton, J.D. (1994), Time Series Analysis, Princeton University Press, New 
Jersey. 
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ou N designe l’ensemble des nombres naturels. Nous recourons a la 
notation plus compacte suivante: 

y = {y t } 

Par exemple : {y 1, y2 > •••> yT} est 11116 realisation du processus stochas- 
tique {y t }. Une telle realisation est souvent appelee trajectoire du 
processus. 

1.1. Stationnarite 

II sera ici question de stationnarite faible ou stationnarite de second ordre. 
Un processus {y t } est dit stationnaire si et seulement si: 

i) E(y t ) = E(y t _ s ) = p, c’est-a-dire que la moyenne du pro¬ 
cessus est ae p, done constante; 

ii) E(y t -p) 2 = E(y t _ s -p)' = a 2 y , c’est-a-dire que la variance 
est invariable dans le temps; 

iii) E[(y t -p)(y t _ s -p)] = E[(y H -p)(y t _ H -p)] = y s . L’auto- 
covariance ne depend done que de la distance entre deux 
points dans le temps et non d’une date particuliere. 

1.2. Processus autoregressifs stationnaires: 
representation et estimation 

Un processus autoregressif d’ordre p, note AR(p), se definit comme 
suit: 


y t = 5 + 0 iyt _! + 0 2 y t _ 2 +... + 0 p y t _ p + e t t = 1, ..., T 

ou t denote le temps e t ~ WN(0, <j e 2 ), et WN est un bruit blanc 
homoscedastique, c’est-a-dire que Cov(e t , e s ) = 0 pour tout t et s, E(e t ) 
= E(e s ) = 0 pour tout t et s et V(e t ) = V(e s ) = cr e 2 pour tout t et s. Une 
autre representation de AR(p) couramment utilisee est celle qui recourt 
a l’operateur de retard L, qui retarde une variable d’une periode: 

0(L)y t = 8 + e t 
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ou 0 (l) = 1 —0jL —0 2 L 2 —0 p L p . Void quelques proprietes de 
l’operateur L: 

i) Lc = c, ou c est une constante; 

ii) LxLx...xL = L n ; 

iii) L n y t = y t _ n 

iv) (l-L) = 1 + L + L 2 +..., ce qui est la formule de la progres¬ 

sion geometrique de raison L. 

On peut exprimer AR(p) sous la forme d’une moyenne mobile 
infinie: 


5 e t 

y, = e(Lj + e(Lj 

Par exemple, dans le cas particulier d’un AR(1), on a: 

yt=-^-+E e t( L 0 i ) 1 

1-0! i=0 

Nous abordons maintenant les proprietes statistiques du pro¬ 
cessus AR(1). L’esperance du processus AR(1) est la suivante: 

E(y t ) = 8 + 0,E(y t _ 1 ) + E(e t ) 

Et si le processus est stationnaire, alors E(y t ) = E(y t _!), ce qui 
implique: 


E(y t ) = S + GjEfy^ + O =-= p 

1 - 0 ! 

Pour que E(y t ) soit finie, il faut que 0,^1. En fait, pour respecter les 
conditions de stationnarite, il faut que: 0 < 0 < 1. 

Par ailleurs, la variance de y t est egale a: 

V(y, ) = o; = eiv(y+ v(e, ) = e , 2 V(y,) + oj 

D’oix, 
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L’autocovariance entre y t et y t _i se calcule comme suit: 

Cov (y t >y t-i) = E [(y t - ^)(y t -i - p)] 

Pour simplifier les calculs, supposons que (x est egal a 0. En rempla- 
gant y t par sa valeur, on obtient: 

Cov(y t , y t _j ) = E(y t y t _j) = E[(0 iy t _ t + e t )y t _j ] 

= 0iE(y t _i ) 2 + E(e t y t _!) = 0 1 E(y t _ 1 ) 2 + 0 = 0,oJ = 0 X -^-y 

\ 1 —0 r 


La covariance entre y t et y t _k est egale a 0^0? = y k . 

A partir de la fonction d’autocovariance, on peut definir la fonc- 
tion d’autocorrelation (ACF) 3 comme suit: 


Pk = 


corr(y t ,y t _ k ) = 

Cov (y t .y t -k) _ 


Cov(y t ,y t -k) 

„„ 


V(y t ) Yo 


k = 0, ± 1, ± 2,... On constate que la correlation s’attenue avec k, soit 
la mesure de la distance. La fonction d’autocorrelation est symetrique, 
c’est-a-dire que: p_ k = p k . Comme p 0 = 1 et que la fonction d’auto¬ 
correlation est symetrique, on utilisera k > 1 lorsqu’on analyse une 
fonction d’autocorrelation. 


2. Estimation du processus autoregressif AR(p) 

On peut reecrire le processus AR(p) sous la forme suivante: 

0(L)y t -8 = e t 


3. ACF est l’abreviation de Autocorrelation function en anglais. 
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Pour estimer les parametres du polynome 0(L) et du parametre 8, il 
suffit de minimiser la fonction suivante: 

T 

MinS(e,5) = Min^e t 2 

La minimisation de cette somme nous ramene a la methode des MCO. 
Cependant, dans le contexte de ce processus autoregressif, l’estimateur 
des MCO est biaise mais convergent. De fagon a illustrer ce probleme 
de biais et pour expliciter davantage comment on estime ce type de 
modele, on reecrit le processus AR(p) pour chaque observation de la 
fagon suivante: 

y P+ i = § + 0iy P + 0 2 y P -i + - + e P y P -( P -i) + e P+ i 
y P+ 2 = § + 0iy P+ i + 0 2 y P + - + 0 P y 2 + e P+2 


y T = 8 + 01 y T _j + 0 2 y T - 2 + - + e P yT- P + e T 

Sous forme matricielle, ce systeme s’ecrit: 

y = X(3 + e 

Considerons le cas d’un processus AR(1). Sous forme matricielle, on 
a alors: 



y 2 


1 yi 




e 2 


Yi 


i y 2 




e 3 

y = 

_y T _ 

x = 

1 y T -i_ 

(3 = 

'5' 

A. 

e = 

_ e T _ 
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On remarque que la variable explicative y 2 est reliee a e 2 , que la 
variable explicative y 3 est reliee a e 3 et ainsi de suite. En appliquant les 
MCO sur ce processus, on obtient evidemment que: 

P = (x T x)-'x T y 

Or, 

p lim P = (3 

Mais E^X T e j 0 => e|| 3 j ^ |3. Les MCO sont par consequent biaises. 
Ce cas se generalise facilement a celui du processus AR(p). 

Dans le modele AR(p), la variance de P est donnee par: 

v(p) = d*(x T x)~‘ 


ou tig est egal a 


(y-xp) T (y-xp) 

a = - 

T-2p-l 

3. Fonction d'autocorrelation partielle (PACF) 4 

Pour determiner 1’ordre p d’un processus autoregressif, on recourt a 
la fonction d’autocorrelation partielle. Dans un processus AR(2), 02 
evalue l’autocorrelation partielle notee par 022 qui peut etre estimee 
par les MCO. Si l’on estime un processus AR(3) alors que le vrai 
processus est un AR(2), on devrait observer que 03 n’est pas significa- 
tif. Pour un modele AR(p), l’autocorrelation partielle d’ordre p, notee 
par 0 pp , est estimee par 0 p . 

Plus precisement, l’autocorrelation partielle 0 pp mesure l’asso- 
ciation lineaire entre y t et y t _ p , compensee pour 1’effet des autres 
variables, soit y t _i, y t _2 jusqu’a y t -p-i. La fonction d’autocorrelation 


4. PACF est l’abreviation anglaise d & partial autocotrelation function. 
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partielle est la suite {0n, 022, - -0 pp }- La figure 9.1 represente le 
graphique d’une PACF pour un AR(1) d’une serie yl simulee dans le 
logiciel EViews. 


Figure 9.1 


Nombre d'observations: 100 


Auttocorrelation 

Correlation partielle 


AC PAC 

Q-stat 

Prob. 
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-0.204 0.043 

360.97 

0.000 


Les droites en pointilles verticales represented une marge de deux fois 1’erreur. 


AC : coefficient d’autocorrelation 

PAC: coefficient d’autocorrelation partielle 

Q-stat: statistique de Box-Pierce-Ljung [16.581] 

Prob.: probability de 1’hypothese que tous les coefficients d’autocorrelation soient 
nuls en ce point. 

Source: Johnston, J. et J. Dinardo (1997), op. tit., p. 217. 


L’ordre p d’un modele AR(p) sera choisi de telle sorte que Gy. A 0 
pour k = pet 0 kk = 0 pour lop. Done, si 0kk est significativement 
different de 0 pour p = k et egal a 0 pour k > p, on peut alors determi¬ 
ner l’ordre par le test suivant: 

HO: 0]^ = 0 pour k > p 
HI: Gy. ^ 0 pour k = p 
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Sous l’hypothese nulle, on sait que: 0 kk est asymptotiquement 

malement distribue avec moyenne 0 et variance egale a: V^0 kk j = 
On peut alors construire la statistique t asymptotique suivante: 


iVTBji-frNfO,!) 


Le test bilateral se formule comme a l’accoutumee. On rejette HO 
pour a = 5 % si t > 2. D’ou 1’intervalle de confiance: 0|^ ± —— 5 . 

VT 


3. Processus de moyennes mobiles: MA(q) 6 

Un processus de moyenne mobile, note MA(q), stationnaire par defi¬ 
nition, s’ecrit comme suit 7 : 

y t = V + e t + + a 2 e t _ 2 +... + a q e t _ q 

On peut exprimer cette equation sous forme plus compacte en utili- 
sant l’operateur de retard: 


y t =H + a(L)e t 


a(L) = l + a 1 L+a 2 L 2 + ... + a q L q 
et e t ~ WN(0, CT e 2 ). 


5. Nous avons retenu comme seuil critique pour a = 5 % la valeur 2. En fait, quand 
T se dirige vers l’infini, le seuil critique est de 1,96. A 60 observations, ce seuil 
est de 2. D’ou ^approximation de 2 que nous avons retenue. 

6. MA est l’abreviation de 1’expression anglaise: moving average, q represente l’ordre 
de la moyenne mobile. 

7. Nous avons ici incorpore une constante dans le modele general d’un MA(q). 
Notons toutefois qu’il est d’usage de l’omettre. 
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Le theoreme de Wold 

Nous ouvrons ici une parenthese sur le theoreme de la decomposition 
de Wold (1938), considere comme fondamental dans le domaine des 
series temporelles. En vertu de ce theoreme, tout processus stochas- 
tique {y t - |Ji} stationnaire au sens faible et purement non deterministe 
peut etre ecrit comme une combinaison lineaire (dite encore filtre 
lineaire ) d’une sequence non correlee de variables aleatoires. Ce filtre 
lineaire est justement le modele de moyenne mobile que nous avons 
represente precedemment mais dont l’ordre q est infini: 

y t - p = e t + + a 2 e t _ 2 + ••• = 52 a i e t-i 

i=0 

ou a 0 = 1. En termes plus concrets, on peut inverser tout processus 
stationnaire sous forme d’un MA infini qui peut etre approxime par 
un ARMA(p, q) d’ordre faible. Ce theoreme prend acte de l’impor- 
tance du phenomene de stationnarite dans l’analyse des series tempo¬ 
relles. 


Proprietes du processus MA(1) 

Pour demontrer qu’un processus MA est stationnaire, on calcule 
d’abord 1’esperance d’un tel processus, ici d’ordre l 8 . 

y t = p + e t +a 1 e t _ 1 

et e t ~ WN(0, cj e 2 ). Son esperance est de p puisque e t est un processus 
stationnaire. La variance de y t est de: 

V(y t ) = V(p + e t -t-aje^j) = 0 + a 2 +a 2 a 2 =(l + a 1 2 )a 2 = y 0 


8. Les MA(q) de q faible sont dits de courte memoire (short memory). 
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Par ailleurs, 

Yx =Cov(y t ,y t _ 1 ) = E[(y t -E(y t ))(y t _ 1 -E(y t _ 1 ))] 

= e[(m. + e t + a iet _! - n)(n + e t _, + a iet _ 2 - (a)] 

= E[(e t + (Xje^! )(e t _j + c^e^)] 

= E^e t e t _ 1 +a 1 e t e t _ 2 +a 1 ej_ 1 +aie t _ 1 e t _ 2 ] 

= E[aie?_i] 

= a x ag 

Pour sa part, y 2 = Cov(y t ,y t _ 2 ) = 0. On peut demontrer que pour 
tout k plus grand que 1, toutes les autocovariances sont nulles pour le 
cas du MA(1). On en deduit la propriete suivante pour la fonction 
d’autocorrelation d’un MA(1) : 


Pk = 


Yk_ 

Yo 

0 


a i 

1+ocj 


pour k = 1 
pour k > 1 


Generalisons maintenant pour le cas d’un MA(q). Sa fonction 
d’autocorrelation se presente comme suit: 


q-k 

E«,« 




pour k = 0, 1, 2, q 


pour k > q 


Parce que la fonction d’autocorrelation est egale a 0 pour les 
retards superieurs a q, on peut done identifier 1’ordre d’un MA(q) a 
partir de la fonction d’autocorrelation. En pratique, on estimera la 
fonction d’autocorrelation par: 


E(y,-y)(y,-t-y) 



L(y,-y) ; 
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Pour identifier l’ordre d’un MA(q), on utilise le test t comme on l’a vu 
precedemment pour tester HO: rt = 0 versus HI : p k ^ 0. Le test se 
formule comme suit: 


t = Pk Pk = VTp k 4 n(0,1) 

V v (pk) 


On rejette HO au seuil de a = 5 % si la valeur absolue de t excede 2. On 
peut egalement construire l’intervalle de confiance de pk comme suit: 


Pk± 


Vt 


4. Estimation d'un MA(q) 

A l’instar du modele autoregressif, pour estimer les parametres d’un 
MA(q) on ecrit l’equation des e t et on minimise par la suite la somme 
des erreurs au carre. Plus precisement: 

T 

MIN s(a 1 ,a 2 ,...,a ) = MIN Ye 2 t 

«i,a 2q v 4 ' a,,a 2 ,...,a q ^ 

ou e t = y t - a(L) e t . S(.) etant une fonction non lineaire de a, on 
aura alors recours aux methodes d’estimation non lineaires, telles que 
les moindres carres non lineaires ou encore le maximum de vrai- 
semblance. 

Pour constater que le modele d’un MA(q) requiert une methode 
d’estimation non lineaire, on peut se servir d’un modele MA(1) qui se 
generalisera par la suite au MA(q). Celui-ci s’ecrit: 


y t = e t +a 1 e t _ 1 

ou on a suppose que p est egal a 0. Substituons la valeur de e t -i de 
fagon repetee, c’est-a-dire: 

y t = e t + a! (y t _! - a! (y t _ 2 - a iet _ 3 )) 

= e t + ocjy^ -aiy t _ 2 + 0Cie t _ 3 
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Nous pourrions continuer ces substitutions en remplagant e t _3 par sa 
valeur. On obtient alors que: 

e t = y t - a iy t-i + «iy t-2 - «i 3 y t -j + - - “"“Vt-n+i + a " e t- n 

On peut reecrire une MA(1) de fagon compacte en recourant a l’ope- 
rateur de retard: 


y t =a 1 (L)e t =(l + a 1 L)e t 

Le processus MA(1) peut etre inverse pour dormer un processus AR 
d’ordre infini a condition bien sur que |a, | < 1. On a: 

(l + CCjL) 1 y t = e t 


(l + ajL) ^^-(-ajL] 1 = l + l-a^L + ^a^L 2 T^a^L 3 +... 

On voit done ici que e t est effectivement une fonction non lineaire de 
ses parametres. C’est pourquoi 1’on recourt a une methode d’estima- 
tion non lineaire. 


5. Modeles ARMA (p, q) 

Le modele ARMA(p, q) est mixte en ce sens qu’il combine modele 
autoregressif (AR) et modele de moyenne mobile (MA), d’ou son 
appellation ARMA. Le modele ARMA(p, q) s’ecrit comme suit: 

y t = 8 + 0 iyt-i + 0 2y t-2 + -+ e P yt- P + e t 

+a 1 e t _ 1 + a 2 e t _ 2 +... + a q e t _ q 
Sous forme compacte, ce processus s’ecrit: 

0(L)y t =5 + a(L)e t 

ou e t est un bruit blanc homoscedastique de moyenne nulle. 
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Proprietes du modele ARMA(1, 1) 

Avec le modele AR(1), le modele ARMA(1, 1) est celui que l’on 
rencontre le plus souvent dans la litterature financiere. II s’ecrit comme 
suit: 


y t = 8 + + e t + c^e,^ 

ou e t est un bruit blanc de moyenne nulle et de variance a 2 . L’espe- 
rance non conditionnelle de y t nous donne l’expression suivante: 


E(y t ) = 


8 

l-0i 


Pour le calcul de la variance de y t , nous faisons l’hypothese que 8 est 
nul. 


v(y,) = v 0 = E [(y,-E(y,)) 2 ]-;( 1 ^|^) 

ou 1’on suppose que E(y t ) est nulle. Alors 1’autocovariance se calcule 
comme suit: 

Cov(y t ,y t _ 1 ) = Yi 

= E [(y t - E (y t ))(y t -i - E (y t -i))] = 0 iY o + 

et ou 

Yk= 9 iYk-i pour k >2 

La fonction d’autocorrelation pour le modele ARMA(1, 1) est de: 
p _ Yi _ ( 1 + 9 i a i)( 9 i +a i) 

Y 0 l + ai+20^! 
et 

Pk = 9 iPk-i P our k ^ 2 
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Generalisons maintenant au cas du ARMA(p, q). La fonction 
d’autocorrelation de ce modele est donnee par: 

Pk =0iPk-i+02Pk-2+- + 0 p Pk—p 

pour k > q. 


6. Introduction aux processus stochastiques 
NON STATIONNAIRES : MODELES ARIMA (p, d, q) 


Jusqu’ici, nous avons considere des processus stationnaires. Cepen- 
dant, en finance, les series financieres sont bien souvent non station¬ 
naires. Le modele ARIMA 9 (p, d, q) est tout designe pour cette categorie 
de series. L’ajout du I dans l’acronyme ARMA designe 1’ordre d’inte- 
gration requis pour atteindre la stationnarite. En effet, on peut rendre 
stationnaire une serie non stationnaire simplement en la differenciant. 
Par exemple, un processus integre d’ordre 1 (d= 1) doit etre differen¬ 
ce une fois pour atteindre la stationnarite. Le qualificatif integre 
provient du calcul differentiel et integral. En effet, comme: 


alors, y t est egal a: 


x t = 


d y t 

dt 


y t = | x t dt 

Transposons ces equations au cas discret. On 


x t = Ay t 

ou, par analogie avec le cas continu, y t est une somme infinie de x t , 
c’est-a-dire: 


x t = Ay t = (l-L)y t => y t = (l —L) X x t = ^1 + L + L 2 +...j x t 

ce qui est en fait une somme infinie de x t . On voit done qu’une serie 
integree d’ordre 1 se ramene a une somme infinie de retards, d’ou le 


9. ARIMA est l’abreviation de: autoregressive integrated moving average. 
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concept d’integration. Ce cas se generalise a une serie integree d’ordre 
d, qui revient a differencier la serie d fois, done a effectuer d integrates. 

Un modele ARIMA (1,1,0) a la forme suivante: 

y t =y t -i+ e t 

et est en fait un modele AR(1) ou 0i = 1, aussi appele marche aleatoire. 
Ce modele doit etre differencie une fois pour atteindre la stationnarite, 
e’est-a-dire: 


A Vt =y t -y t -i =e t 

ou e t , nous l’avons mentionne, est un bruit blanc, par consequent 
stationnaire. Par consequent, un processus integre d’ordre d, e’est-a- 
dire: A d y t = (l-L) y t , doit etre differencie d fois pour atteindre la 
stationnarite. A titre d’exemple, supposons un processus stochastique 
x t qui est integre d’ordre 2, soit: 

A 2 x t = (i - L) 2 x t = (i - 2L + L 2 )x t = x t - 2x t _ t + x t _ 2 

Pour les processus integres (non differencies), les ACF sont tres signi- 
ficatives jusqu’a des k (retards) contrairement aux ACF de processus 
stationnaires qui se dirigent vers 0 pour des k eleves. 


7. La methode de Box et Jenkins 10 

La methode de Box et Jenkins consiste a deceler la forme du modele 
ARIMA qui reproduit le mieux la serie financiere analysee. Cette 
methode comporte trois etapes: i) l’identification; ii) l’estimation; 
iii) les tests et diagnostics. Dans ce qui suit, nous allons developper ces 
trois etapes. 


10. Box, G.E.P. et G.M. Jenkins (1976), Time Series Analysis: Forecasting and Control, 
Holden-Day, San Francisco. Un autre livre qui est aussi a l’origine de 1’analyse 
des series temporelles et qui adapte la methode de Box et Jenkins aux sciences de 
la gestion est: Nelson, C.R. (1973), Applied Time Series Analysis for Managerial 
Forecasting, Holden-Day, San Francisco. 
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i) L'identification 


L’identification se base principalement sur l’analyse des ACF et PACF 
des series economiques et financieres considerees. On peut distinguer 
les cas d’espece suivants: 

1) Si l’ACF decroit lentement vers 0, c’est-a-dire que pour des 
retards eloignes, les coefficients d’autocorrelation demeurent 
significatifs, on considere alors que cette serie est non sta- 
tionnaire. On devra alors differencier cette serie une fois et 
parfois meme deux fois pour la rendre stationnaire. Un 
modele ARA1A d’ordre p et q peu eleve pourra etre ensuite 
estime sur la serie stationnarisee. 


2 ) 


3) 


Pour un processus MA(q), l’ACF: p(k) est egale a 0 pour 
k> q et la PACF decroit geometriquement vers 0. Pour de¬ 
terminer 1’ordre q de ce processus, il faut comparer l’ACF: 


p(k) a 


"Vt* 


Pour un processus AR(p), la PACF: Gkk est egale a 0 pour 
k>p et l’ACF decroit geometriquement vers 0. Pour deter¬ 
miner 1’ordre p de ce processus, on compare la PACF: 0|<i< 


2 



4) Si l’on ne trouve pas de point de rupture precis, un modele 
ARMA pourrait etre pertinent. Par exemple, etant donne 
qu’un ARMA(1, 1) est une combinaison d’un modele AR et 
d’un modele MA, on s’attend a ce que l’ACF ait les caracte- 
ristiques des modeles AR et MA combines. La portion MA 
disposant d’une memoire d’une periode seulement, le point 
de rupture devrait se produire apres une periode. Par ailleurs, 
la composante AR dispose d’une ACF qui decroit geometri¬ 
quement et on anticipe ce profil pour des retards superieurs 
a une periode. 


ii) L'estimation 

Si un modele AR a ete identifie, alors l’estimation se fera par les 
MCO. Par ailleurs, si on a identifie un modele MA, l’estimation se 
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fera par les moindres carres non lineaires (NLS) ou par la methode 
ML. Si un modele ARMA a ete identifie, l’estimation s’effectuera par 
la methode des NLS ou la methode ML, ou encore par la methode 
des MCO en deux etapes 11 . 


iii) Tests et diagnostics 

Dans cette sous-section, nous traitons de la surparametrisation (over- 
fitting) et des tests sur les residus. 


La surparametrisation 

Si un modele ARIMA(p, d, q) a ete identifie, la surparametrisation 
consiste a estimer un modele ARIMA(p + 1, d, q) ou un modele ARIMA 
(p, d, q + 1) ou les deux et faire un test sur le ou les parametres addi- 
tionnels. Si le vrai modele est un ARIMA(p, d, q), les tests sur les 
parametres additionnels ne devraient pas etre significativement diffe- 
rents de 0. 


Analyse des residus 


Une fois l’estimation des modeles ARIMA completee, on calcule les 
residus de fagon a degager les ACF et PACF de ces residus. On devrait 
trouver que la fonction d’autocorrelation est non significative pour 


tous les retards en comparant p k a ——. Une procedure plus scienti- 

V T 

fique est de calculer le test Ljung-Box (1978). Ce test, que 1’on designe 
par la statistique Q, se formule comme suit: 


K q2 

Q = T(T + 2)V-^ 

ti T-k 


11. Au sujet de la methode des moindres carres en deux etapes, on consultera: 
Gourieroux, C. et A. Monfort (1990), Series temporelles et modeles dynamiques, 
Economica, Paris. 
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L’hypothese HO est la suivante: p x = p 2 = ... = p k =0. Ce test est 
asymptotiquement distribue comme une y 2 (k-p-q). 


8. Autres criteres de selection 

POUR LES MODELES ARMA 

On peut distinguer deux criteres de choix de modeles: celui d’Akaike 
(1973) et celui de Schwarz (1978). Le critere d’Akaike, designe par 
AIC 12 , se definit comme suit: 


AIC = In 


2 (p+q +1 ) 


^ T J T 

Par ailleurs, le critere de selection de Schwarz, designe par SC 13 , se 
calcule comme suit: 


SC = In 



p+q +1 

T 


I n (T) 


Ces deux criteres remplacent le R 2 dans l’analyse des series tempo- 
relles. On cherche le modele qui donne la valeur minimale a ces deux 
statistiques. Par exemple, si un ARMA(1, 1) se traduit par des statis- 
tiques AIC et SC plus faibles qu’un ARMA(2, 1), on choisira le modele 
ARMA(1, 1). 

On remarquera que les deux criteres penalisent l’ajout de degres 
de liberte, ce qui milite en faveur du principe de la parcimonie dans 
l’etablissement d’un modele, ce qui se compare davantage au R 2 ajuste 
qu’au R 2 non ajuste. 


12. AIC est l’abreviation anglaise de: Akaike Information Criterion. 

13. SC est l’abreviation anglaise de : Schwarz Criterion. 
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9. Previsions A l # aide de modeles statistiques 

DE SERIES CHRONOLOGIQUES 

Une fois un modele specific, estime et teste, on peut l’utiliser pour 
effectuer des previsions. Envisageons d’abord le cas d’un modele 
ARMA(1, 1). 

Prevision a I'aide d'un modele ARMA(1, 1) 

Le modele ARMA(1, 1) se formule comme suit: 

y t = 8 + 0!y t _x + e t + o^e^ 

Soit h le nombre de periodes a 1’avance au chapitre de la prevision. 
Considerons d’abord le cas ou h est egal a 1. Nous sommes a la fin de 
l’echantillon T. Nous voulons prevoir l’observation en (T + 1) qui se 
trouve dans le futur immediat. On a, en vertu du modele ARMA(1, 1): 

y T+1 = 8 + e iyT + e T+1 + a^T 

L’esperance conditionnelle (Et) de cette equation correspond a la 
prevision MMSE ( minimum mean square error) de y x+ i: 

y T+ i = E t (y T+1 ) = 8 + 0 iyT + 0 + a ieT 

ou l’esperance conditionnelle 14 de e x+ i estnulle et E T (a,e T ) = a,e T . 
Incidemment, on se sert de l’esperance conditionnelle pour formuler 
des previsions a court terme et de l’esperance inconditionnelle pour 
formuler des previsions a long terme. La variance de l’erreur de 
prevision se calcule comme suit: 

V(e T+ j) = V(y x+1 “Yt+i) = V(e x+ i) = a e 

Soit ensuite le cas ou h = 2, cas ou l’on calcule la prevision de y 
deux periodes a 1’avance. Toujours en vertu du modele ARMA(1, 1), 
on a: 


y t +2 - E x (y x+2 ) - E T (8 + 0 1 y x+1 +e x+2 d-o^e-p^) 
= 8 + 0 1 E T (y x+1 ) = S + Ojy-r^ 


14. Conditionnelle a I’information disponible jusqu’a la fin de l’echantillon T. 
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L’erreur de prevision est bien sur: 


^T+2 - yT+2 — y T+2 - § + 0iyT+l + e T+2 +0c l e T+l -§-0iyT+i 

= 0i (y-r+i - yT+i) + e T+2 + a i e T+i 
= (0i+a 1 )e T+ i+e T+ 2 

Fort de ces calculs, on calcule la variance de 1’erreur de prevision: 

V(e T+2 ) = (0i +cc!) 2 ag +o 2 e = +aj) 2 + lj 

En procedant de la sorte, pour h = 3, on obtient: 

y T+3 =8 + e 1 y T+2 

et la variance de l’erreur de prevision est de: 

V (e T +3 ) = j ^ 1 + ( e i + 0 C l) +(®1 + 0 lOC, ) j 

Comme on 1’aura constate, les previsions sont obtenues par subs¬ 
titutions repetees dans le modele initial ARMA(1, 1). Deplagons-nous 
vers le modele general ARMA(p, q) qui se formule comme suit: 

y t = 5 + 0jy t _! + 0 2 y t -2 + - + 0 p y t-p + e t + tt l e t-l + - + a q e t-q 

On peut effectuer une prevision pour h periodes periodes a l’avance; 
on calcule l’esperance conditionnelle et on obtient: 


y T +h = 5 + 0 iyT+h-i + 0 2yT+h-2 + -+ 0 h-iyT+i 

+ 0 h y T + - + 0 p yT-p+h + a h e T + - + “q^T-q+h 

L’intervalle de confiance de cette prevision est de: 

l 

yT+h ±z c V(e T+h )2 

ou z c est la valeur critique d’une N(0, 1) au niveau a retenu. Mention- 
nons que cet intervalle de confiance est asymptotique, c’est-a-dire que 
l’echantillon doit etre suffisamment grand si l’on utilise des estimes 
des parametres a la place des parametres comme tels pour effectuer les 
calculs precedents. 
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10. Evaluation de la precision des previsions 

On distingue quatre criteres pour evaluer la precision des previsions: 
i) le RMSE (root mean square error ); 2) le MAE (mean absolute error ); 
les deux statistiques U de Theil. Ces criteres donnent lieu au choix 
d’un modele qui minimise lesdits criteres. 

Le RMSE est egal a: 


RMSE = 


Lfy.-y ,) 2 


ou no represente le nombre de periodes predites. 
Pour sa part, MAE se definit comme suit: 


Lly.-y.l 

MAE = - 


Remarquons que ces deux criteres sont sujets a des problemes d’unites 
de mesure. Les deux statistiques U de Theil corrigent pour ce pro- 
bleme. La premiere, denotee par U, est egale a: 


'( 1/n o)E(yi-7i) 2 

( 1/n o)£y 1 2 


Remarquons que cette mesure est reliee au R 2 mais n’est pas limitee 
a l’intervalle (0, 1). Une mesure apparentee consiste a calculer les 
variations de y: 


( 1/n o)L( A ^i _A yi) 
1 ( 1/n o)E A yi 


© 2001 - Presses de l’Universite du Quebec 

Edifice U Delta 1,2&T5, boul. limner, bureau 450, Quebec, Quebec G1V 2M2 • TCI (418) 657-4399 - www pug ca 

Tird : Traite d'econometrie financiere, Frangois-Eric Racicot et Raymond Thdoret, ISBN 2-7605-1123-5 • D1123N 










250 Traite d’econometrie financiere 


Toutes ces mesures mesurent la capacite des modeles a capter les 
differents points de retournement des series temporelles. 


11. Applications 

Pour illustrer ce chapitre ayant trait aux series chronologiques, nous 
nous basons sur une serie chronologique ayant trait au marche obliga- 
taire. Le rendement retenu est celui de l’obligation corporative ame- 
ricaine cotee Aaa selon le systeme de notation Moody’s. Les donnees 
sont mensuelles et s’etirent de 1990 a 1994 15 . La figure 9.2 retrace 
l’evolution de ladite serie sur la periode consideree, denommee Y. Ce 
graphique a ete genere par le logiciel EViews. 


Figure 9.2 





15. Cette serie est tiree de Greene (2000), op. tit. 
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Un examen rapide de la figure 9.2 semble reveler que cette serie 
n’est pas stationnaire. Pour verifier 1’hypothese de stationnarite, nous 
presentons, a la figure 9.3, les calculs et graphiques quant aux 
autocorrelations to tales et partielles. 


FIGURE 9.3 Correlogramme de Y 


Date: 08/30/00 Time: 11:48 
Sample: 1990:01 1994:12 
Included observations: 60 


Autocorrelation 

Correlation partielle 


AC PAC 

Q-stat 

Prob. 



- 1 1 

1 

1 

0.967 0.967 

58.904 

0.000 





1= 

1 

2 

0.909 -0.384 

111.90 

0.000 



1 

1 

1 1 

3 

0.853 0.143 

159.37 

0.000 



1 

1C 

1 

4 

0.795 -0.150 

201.33 

0.000 



1 

1 

1 1 

5 

0.736 0.020 

237.93 

0.000 



1 

i n 

1 

6 

0.674 -0.101 

269.26 

0.000 



1 

1 c 

1 

7 

0.606 -0.123 

295.02 

0.000 



-1 

1 c 

1 

8 

0.530 -0.090 

315.15 

0.000 



1 

1 c 

1 

9 

0.451 -0.082 

330.00 

0.000 



ZD 

i 

] 1 

10 

0.379 0.110 

340.70 

0.000 



_ 

] 

i 

1 

11 

0.318 0.015 

348.36 

0.000 





i [ 

1 

12 

0.260 -0.043 

353.59 

0.000 



□ 


i 

] 1 

13 

0.209 0.106 

357.04 

0.000 



□ 


i i 

1 

14 

0.165 -0.025 

359.25 

0.000 



□ 


i 

1 1 

15 

0.127 0.053 

360.57 

0.000 





i i 

1 

16 

0.095 0.000 

361.33 

0.000 



] 


IC 

1 

17 

0.059 -0.207 

361.63 

0.000 





IC 

1 

18 

0.014 -0.131 

361.65 

0.000 





1 1 

1 

19 

-0.030 -0.020 

361.74 

0.000 





1 

1 1 

20 

-0.069 0.035 

362.17 

0.000 


: 



1 [ 

1 

21 

-0.103 -0.072 

363.19 

0.000 


c 



1 

] 1 

22 

-0.136 0.003 

365.00 

0.000 


c 



1 

1 1 

23 

-0.165 0.026 

367.75 

0.000 


□ 



1 

] 1 

24 

-0.190 0.092 

371.47 

0.000 


c 



1 E 

1 

25 

-0.218 -0.116 

376.50 

0.000 


d 



1 [ 

1 

26 

-0.251 -0.070 

383.42 

0.000 

d 



1 C 

1 

27 

-0.284 -0.094 

392.54 

0.000 

d 



1 

1 1 

28 

-0.311 0.028 

403.81 

0.000 


En examinant la structure des autocorrelations totales, on peut 
observer des autocorrelations persistantes pour des retards eloignes, 
ce qui pourrait indiquer que 1’hypothese de non-stationnarite pourrait 
etre violee. Mais, pour l’instant, nous mettons en veilleuse ce probleme 
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pour nous concentrer sur les ACF de la serie qui semblent indiquer 
qu’un modele AR(2) est approprie. L’estimation de ce modele appa- 
rait au tableau 9.1. 

Tableau 9.1 


Dependent Variable: Y 

Method: Least Squares 

Date : 08/30/00 Time : 11:51 

Sample: (ajusted): 1990:03 1994:12 

Included observations: 58 after adjusting endpoints 

Convergence achieved after 3 iterations 


Variable 

Coefficient 

Std. Error 

t-Statistic 

Prob. 

C 

7.876779 

0.441819 

17.82807 

0.0000 

AR(1) 

1.156648 

0.110660 

10.45226 

0.0000 

AR(2) 

-0.208293 

0.110161 

-1.890803 

0.0639 

R-squared 

0.962990 

Mean dependent var 

8.254138 

Ajusted R-squared 

0.961644 

S.D. dependent var 

0.794039 

S.E. of regression 

0.155511 

Akaike info criterion 

-0.833866 

Sum squared resid 

1.330096 

Schwarz criterion 

-0.727292 

Log likelihood 

27.18212 

F-statistic 


715.5335 

Durbin-Watson stat 

1.418410 

Prob(F-statistic) 

0.000000 

Inverted AR Roots 

.93 

.22 




Examinons la stationnarite de cette serie a partir des coefficients 
estimes des retards sur la variable dependante. Mais auparavant, rap- 
pelons les conditions de stationnarite pour un AR(2). Dans ce cas, la 
serie converge si les coefficients du AR(2) respectent les conditions 
suivantes: 1) |0 2 |<1; 2) + 0 2 < 1 ; 3) 0 2 — 0 X < 1. Nous pouvons 

verifier au tableau 9.1 que ces trois conditions sont respectees pour la 
serie analysee. De fapon plus generale un processus autoregressif 
d’ordre p est stationnaire si les racines de 1’equation caracteristique 
suivante: 


C(z) = l-0jz-0 2 z 2 —... — 0 p z p 

ont un module superieur a 1 ou, de fapon equivalente, se situent a 
l’exterieur du cercle unitaire. 


© 2001 - Presses de l’Universite du Quebec 

Edifice u Delta 1,2&T5, boat Lamer, bureau 450, Quebec, Quebec G1V 2M2 • TCI (418) 657-4399 - www paq ca 

Tird : Traite d'econometrie financiere, Frangois-Eric Racicot et Raymond Thdoret, ISBN 2-7605-1123-5 • D1123N 









Les series temporelles 253 


La figure 9.4 presente l’analyse des residus du modele estime. 
On observe que les ACF et les PACF pour tous les retards ne sont pas 
significatifs. Cela confirme que les residus obeissent a un processus de 
bruit blanc. Et l’on en conclut que le modele choisi est le bon puisqu’il 
capte toute ^autocorrelation presente dans la serie. 


FIGURE 9.4 Correlogramme des residus 


Date: 08/30/00 Time: 11:56 
Sample: 1990:03 1994:12 
Included observations: 58 

Q-statistic probabilities adjusted for 2 ARMA term(s) 
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Series temporelles non lineaires 

Selon Franses (1998) 16 , une serie temporelle est non lineaire quand 
des chocs importants ont un impact different de chocs de moindre 

16. Franses, P.H. (1998), Time Series Models for Business and Economic Forecasting, 
Cambridge University Press, Cambridge. 
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envergure dans le sens que l’impact d’un choc n’est pas proportionnel 
a son importance. La non-linearite peut aussi signifier que 1’impact 
d’un choc depend de son signe. Pour modeliser le caractere non 
lineaire des series temporelles, nous envisageons ici deux methodes 
d’estimation: la methode STAR, soit un processus autoregressif de 
transition lisse ou sans cassures {smooth), et le modele econometrique 
base sur les reseaux de neurones, que nous designerons par ANN. 


Le modele STAR 

Supposons que la serie temporelle y t suive le processus suivant: 

y t = 8 + cpy t _j + F(y t _ d )(y + Xy t _,) + 8 t 

ou F(y t _a) est une fonction quelconque de la variable y t _d , dite variable 
de transition. Ce modele, designe par STAR 17 , est la combinaison 
d’un modele lineaire AR(1) et d’un modele non lineaire quand F(y t _d) 
n’est pas nul. On peut interpreter iji F(y t _d) et X. F(y t _d) y t _i comme des 
composantes qui rendent variables dans le temps l’intercept et le 
parametre autoregressif de premier ordre. La fonction de transition 
F(.) est habituellement choisie de telle sorte que ses realisations se 
situent dans 1’intervalle [0, 1]. Par consequent, quand F(.) = 0, y t peut 
etre decrit comme un processus autoregressif AR(1) pur: 5 + cpy t _ x . 
Par ailleurs, quand F(.) = 1, un processus AR(1) avec les parametres 
(8 + i)j) et (cp + X) s’avere pertinent. Finalement, quand 0<F(.)<1, y t 
peut etre decrit comme une somme ponderee de deux processus AR 
lineaires. Cela suggere une forme alternative pour y t : 

y t = t 1 - F (y t -d ))( § i + «iy t -i)+ F (y t -a )( § 2 + a 2 y t -i)+ £ t 

On remarquera que lorsque ai = 1 (ou meme superieur a 1), les effets 
des innovations e t sur la serie y t peuvent encore n’etre que transitoires. 
En d’autres mots, la stationnarite de y t depend de ai, a .2 et de la forme 
specifique de la fonction F(.). Franses (1998) note que tester la 
stationnarite de y t est une entreprise difficile. 


17. Soit Pabreviation de l’expression anglaise: smooth transition autoregressive. 
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La fonction de transition F(.) peut prendre plusieurs formes : i) la 
forme exponentielle suivante, qui donne lieu au modele ESTAR: 

\ 1 (-v(yt-d-c) 2 ) 

F(yt-d) = l-e l 1 

ou 7 > 0 ; ii) la fonction logistique suivante, qui donne lieu au modele 
LSTAR: 


ou 7 > 0; la fonction suivante, qui donne lieu au modele AR a paliers 
ou a seuils, encore designe par modele TAR 18 : 

F (y t -d) = ° pour y t _ d < c 
F (y t -d) = 1 pour y t . d >c 

Le parametre c est appele: parametre de palier (threshold parameter). 
Le modele AR est un cas special du modele LSTAR quand y — > oo. 
Dans le modele ESTAR, y t reagit de fagon symetrique aux valeurs 
positives et negatives de (y t _d - c) tandis que dans le modele TAR, le 
changement de regime est abrupt. Le modele LSTAR comporte pour 
sa part des changements lisses ou sans cassures {smooth) et des reac¬ 
tions asymetriques aux chocs, ce qui rehausse son attrait par rapport 
aux deux autres modeles. 


Le modele econometrique base sur les reseaux 
de neurones (ANN) 

Le modele ANN {artificial neural network) peut etre combine a une 
serie temporelle qui obeit a une dynamique autoregressive de premier 
ordre. En supposant qu’il n’y ait qu’une seule couche cachee dans le 
reseau de neurones, ce modele econometrique s’ecrit comme suit: 
q 

y t = 5 + 4>y t-i +^jy t _i) + e t 


18. TAR est l’abreviation anglaise de: threshold autoregressive. 
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ou q designe le nombre de cellules cachees dans la couche. Contraire- 
ment au modele STAR, le modele ANN se traduit par un intercept 
variable dans le temps. La fonction G(.) prend habituellement la 
forme de la fonction logistique suivante: 

La fonction G(.) est appelee fonction d'activation logistique puisque la 
composante non lineaire du modele ANN ne devient active que si 
l’argument (\|/j +A, J y t _ 1 ) est assez important. A l’instar du modele 
LSTAR, le modele ANN peut decrire des changements de regimes 
dans les series temporelles, en autant que ces changements se confi- 
nent aux intercepts. 

Quand q devient relativement important, le modele ANN peut 
approximer de fagon tres precise toute fonction: 

f(y.)-f(y«)+e. 

Par consequent, le R 2 d’un modele ANN peut se rapprocher facile- 
ment de 1 lorsque q est eleve. Puisque le modele ANN fait la somme 
d’un ensemble de fonctions logistiques, il est toutefois difficile d’inter- 
preter les valeurs des parametres des fonctions G(.). 

Pour estimer les parametres des modeles STAR et ANN, on 
recourt a un algorithme d’estimation non lineaire. Franses (1998) 
suggere d’adopter la strategic suivante pour estimer ces parametres. 
On fixe d’abord les parametres 7 et c a des niveaux donnes et on 
estime les autres parametres par la methode des MCO. On estime 
ensuite les parametres 7 et c par etapes par la methode des moindres 
carres non lineaires. Certes, la valeur de d dans y t _d est incertaine et il 
faut effectuer plusieurs essais sur cet indice de fagon a determiner la 
regression qui comporte le R 2 le plus eleve. Franses (1998) 19 a applique 
le modele LSTAR a la premiere difference du taux de chomage tri- 
mestriel allemand sur une periode s’etirant de 1962 a 1990. Il a trouve 
que le d optimal etait de 1. Le resultat de son estimation est le suivant: 


19. Franses (1998), op. cit., p. 183. 
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Ay t = (l - F(Ay t _j ))(-0,040 + 0,454Ay t _,) 

+F( Ay t _! )(l,901 -1,840Ay t _!) + e t 

ou F(Ay t _j ) = ^1 + e (- 9 > 2 3i(Ay t _,-o,500)) j Qn pguttirgr pbsieurs infor _ 

mations d’une telle estimation qui alterne entre le regime de reprise 
economique et celui de recession. D’abord, en vertu de l’estimation, si 
Ay t _j > 0,500, la fonction F prend une valeur rapprochee de 1, ce qui 
se traduit dans ce modele par une recession du point de vue de 1’emploi. 
En tragant le graphique de F en fonction du temps, on peut ainsi 
identifier les periodes de recession et de reprise economique. Ensuite, 
on peut relier graphiquement F et Ay t _ 1; F etant sur l’ordonnee et 
Ay t _! sur l’abscisse. On obtient alors la fonction de transition des 
recessions aux reprises economiques. Finalement, si l’on identifie un 
trimestre de recession a une valeur de F excedant 0,5, on peut identi¬ 
fier les sommets et les creux du cycle economique classique. 

L’ajout de composantes non lineaires aux modeles autoregressifs 
elargit done de beaucoup le champ de l’analyse econometrique des 
series chronologiques et augmente d’autant l’attrait de ce type d’ana- 
lyse. En recourant aux reseaux de neurones, on peut meme en arriver 
a reproduire quasi exactement toute serie temporelle y t ! Par ailleurs, 
les reseaux de neurones ont egalement ete utilises dans un contexte 
GARCH par Donaldson et Kamstra (1997) 20 pour estimer la volatilite 
du S&P500, entre autres. Pour plus de details sur ce domaine capti- 
vant de 1’econometrie, le lecteur consultera avec interet: Granger et 
Terasvirta (1993); Terasvirta, Tjostheim et Granger (1994); De 
Gooijer et Kumar (1992); Tong (1990); Bishop (1995); Ripley (1994); 
Kuan et Liu (1995); Kuan et White (1994); Swanson et White 
(1995) 21 . 


20. Donaldson, R.G. et M. Kamstra (1997), « An Artificial Neural Network-GARCH 
Model for International Stock Return Volatility », Journal of Empirical Finance, 4, 
p. 17-46. 

21. Granger, C.W.J. et T. Terasvirta (1993), Modelling Nonlinear Economic 
Relationships, Oxford University Press, Oxford; Terasvirta, T., D. Tjostheim et 
C.W.J. Granger (1994), « Aspects of Modelling Nonlinear Time Series », dans : 
Engle, R.F. et D.L. McFadden (dir.), Handbook of Econometrics, volume IV, North 
Holland, Amsterdam; De Gooijer, J.G. et K. Kumar (1992), «Some Recent 
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12. Processus stochastiques non stationnaires 

Dans cette section, nous nous penchons sur les sujets suivants: pro¬ 
cessus de marche aleatoire, processus de marche aleatoire avec ten¬ 
dance, tests de stationnarite et cointegration. 

Marche aleatoire (random walk) 

Une marche aleatoire est un processus stochastique non stationnaire 
qui se definit comme suit dans sa version simplifiee: 


y t = y t -i+ e t 


ou e t ~ WN(0, ct 2 ). Ce processus est un AR(1) sans constante ou 
0, = 1. Si l’on differencie une fois ce modele, i.e. Ay t = y t - y t _i = e t , 
on obtient alors un processus stationnaire. Si l’on veut tester 1’effi- 
cience des marches financiers dans ce contexte, 1’hypothese nulle est 
alors : HO : 0i = 1, ou y t est le rendement d’un titre. Si cette hypothese 
est verifiee, les marches financiers sont alors efficients. Un autre fagon 
de verifier 1’efficience est d’examiner le profil de 1’ACF de Ay t . S’il 
correspond a celui d’un bruit blanc, on a alors efficience. 

Le processus qui vient d’etre decrit correspond a celui d’une 
marche aleatoire avec tendance stochastique (tendance non tempo- 
relle). Precisons ce point. Par substitutions successives dans l’equation 
de base de la marche aleatoire, on obtient: 



Developments in Non-linear Time Series Modelling, Testing and Forecasting », 
International Journal of Forecasting, 8, p. 135-156; Tong. H. (1990), Non-linear 
Time Series. A Dynamical System Approach, Oxford University Press, Oxford; 
Bishop, C.M. (1995), Neural Networks for Pattern Recognition, Oxford University 
Press, Oxford; Ripley, B.D. (1994), «Neural Networks and Related Methods for 
Classification », Journal of the Royal Statistical Society, 56, p. 409-456; Kuan, C.M. 
et T. Liu (1995), Forecasting Exchange Rates using Feedforward and Recurrent 
«Neural Networks», Journal of Applied Econometrics, 10, p. 347-364; Kuan, 
C.M. et H. White (1994), « Artificial Neural Networks: An Econometric Pers¬ 
pective », Econometric Reviews, 13, p. 1-91; Swanson, N.R. et H. White (1995), 
« A Model Selection Approach to Assessing the Information in the Term Struc¬ 
ture Using Linear Models and Artificial Neural Networks », Journal of Business 
and Economic Statistics, 13, p. 265-275. 
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Selon cette equation, ce processus de marche aleatoire ne comporte 
pas de tendance temporelle particuliere. Si on calcule l’esperance non 
conditionnelle de cette valeur, on a: 

E (y t ) = yo 

On en deduit done la propriete que la moyenne d’une marche alea¬ 
toire avec tendance stochastique est constante. L’esperance condi¬ 
tionnelle, quant a elle, du processus de marche aleatoire se calcule: 

E t(yt + i) = y t 

Par consequent, du processus de marche aleatoire avec tendance sto¬ 
chastique, on deduit le resultat que 1’esperance conditionnelle, qui est 
une prevision a court terme, est non constante alors que l’esperance 
non conditionnelle est pour sa part constante. 

De fagon similaire: 


y t+s =yt+E e t+i 

i=l 

Ce processus comporte un trend stochastique parce que le trend 
stochastique est la somme des termes d’erreur. II en resulte que l’es- 
perance conditionnelle n’est pas affectee par ce trend de termes d’er¬ 
reur inconnus, c’est-a-dire: 

E t(yt +S ) = y t 

Pour sa part, la variance de y t est de: 

V(y,) = 0 + £v(e 1 ) = ta 2 

i=l 

D’apres ce resultat, la marche aleatoire n’est done un processus sta- 
tionnaire puisque sa variance augmente avec le temps. 

En finance, une martingale correspond en temps discret a une 
marche aleatoire. On dit en effet qu’un processus stochastique est une 
martingale relativement a l’ensemble d’information I t si: 

E,(y„,) = y, 
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Autrement dit, la meilleure prevision de y t+ i est y t , soit l’observa- 
tion anterieure. On retrouve bien ici le processus de marche aleatoire. 
En finance, des exemples de series suivant une martingale sont les 
cours des actions et les taux d’interet. 

Marche aleatoire avec tendance 

Nous presentons ici le modele avec drift. Ce modele est celui d’une 
marche aleatoire auquel s’ajoute une constante. Ce modele est le 
suivant: 


y t =a o+y t -i+ e t 

ou ao est une constante. II convient de montrer la presence d’une 
tendance dans un tel processus. Par substitutions repetees, on a: 

y t = yo+a 0 t+X! e i 

i=l 

Ce processus presente deux formes de trends : i) un trend deterministe 

represente par aot; ii) un trend stochastique, represente par ^e,. On 

voit que l’esperance d’un tel processus se modifie dans le temps. La 
prevision E(y t+ h) est: 

E t(yt+h) = y t + a oh 

13. Modeles de tendance 

Une equation de difference peut etre eclatee en trois composantes: 
y t = trend + composante saisonniere + composante irreguliere 

Nous avons vu auparavant comment modeliser la composante irregu¬ 
liere a partir d’un modele ARMA(p, q). Nous faisons ici litiere de la 
composante saisonniere, abordee sommairement dans une section 
anterieure ayant trait a l’effet du lundi sur les cours boursiers. Nous 
nous concentrons plutot ici sur la composante tendancielle ou trend 
d’une serie chronologique. Nous faisons ici reference a 1’indice bour- 
sier americain S&P500 qui fait montre d’une tendance a la hausse. 
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Comment peut-on modeliser cette tendance de fagon rigoureuse? 
Deux techniques sont couramment utilisees a cet effet: i) le trend 
temporel lineaire; ii) le trend temporel polynomial. 

Le trend lineaire se presente comme suit: 

y t = a o +ait + e t 

Pour sa part, le trend polynomial se formule comme suit: 

y t = a 0 +ajt + a 2 t 2 + ... + a n t n +e t 

Ces deux equations peuvent etre estimees par les MCO. Ces deux 
equations peuvent egalement comporter des retards sur y t et e t . On 
obtient alors un modele ARMA(p, q) auquel s’additionne un trend 
polynomial. 

Pour enlever la tendance, il existe deux techniques : i) la differen- 
ciation; ii) la technique du retrait de la tendance {detrending). 

D’abord la differenciation. Considerons la solution du modele de 
marche aleatoire avec tendance non temporelle: y t = Yo + a o t + 5^ e i • 
En calculant la difference premiere, on obtient: 

Ay t = 0 + a 0 + e t 
L’esperance de Ay t est de: 

E ( A y t ) = a o 

La variance de Ay t est de: 

V(Ay t ) = a 2 
et: 


Cov(Ay t ,Ay t _ s ) = 0 

Toutes les proprietes d’un modele stationnaire sont done au rendez¬ 
vous. 


L’autre technique utilisee pour enlever la tendance est le 
detrending. Nous venons de voir qu’un modele non stationnaire peut 
etre transforme en un modele stationnaire seulement en le differenciant. 
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Cela ne signifie pas que tous les modeles non stationnaires peuvent 
etre transformes en modeles stationnaires. Pour illustrer, considerons 
le modele suivant. 


y t =a 0 + a x t + e t 

Pour extraire le trend, on estime le modele par les MCO. On obtient: 

Yt-ft=K 


y t =a 0 +ait 

On pourrait par la suite appliquer un modele ARMA sur les residus et 
determiner les techniques etudiees auparavant pour determiner l’ordre 
de ce modele. Au lieu d’effectuer cette regression, on aurait pu exprimer 
y t en premiere difference, soit: 

Ay t =a 0 +e t -e t _ 1 

On constate que la partie en moyenne mobile (MA) comporte une 
racine unitaire. Ce modele ne peut done pas etre inverse sous une 
forme autoregressive. 

De fagon generale, pour eliminer la tendance, on estime le 
modele a trend polynomial par les MCO et, pour determiner le degre 
de ce polynome, on recourt aux tests t, aux tests F ou aux criteres 
Akaike et Schwartz. Le modele a trend polynomial s’ecrit: 

y t =a.Q+&]t + a. 2 V + ... + a n t n +e t 

En appliquant les MCO sur cette equation, on obtient y t . En 
soustrayant y t de y t , on obtient alors la serie stationnaire : {e t }- 

Series en difference stationnaire (DS) 
ou en tendance stationnaire (TS) 

Jusqu’ici, nous avons examine deux categories de series non station¬ 
naires : 

i) la serie en difference stationnaire (DS) 

ii) la serie en tendance stationnaire (TS) 
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Les series DS sont transformees en difference stationnaire en les 
differencial. Quant a elles, les series en tendance stationnaire sont 
rendues stationnaires en eliminant le trend par la modelisation de ce 
dernier. Mais un serieux probleme se presente lorsque, dans ce der¬ 
nier cas, Ton enleve le trend en differencial plutot qu’en le modeli- 
sant. Pour le constater, considerons le modele ARMA(p, q) suivant: 

0(L)y t = a 0 +a 1 t + <I>(L)e t 

ou les ratines du polynome 0(L) et <&(L) se situent en dehors du 
cercle unitaire. Ce modele est TS puisqu’il ne comporte aucune racine 
unitaire. Supposons quand meme que l’on elimine le trend en le 
differenciant. On obtient: 

0(L)y* t =a 1 +(l-L)o(L)e t 

La differentiation a fait apparaitre une racine unitaire dans la partie 
MA du processus. De fagon parallele, eliminer par modelisation du 
trend le trend d’un modele DS ne se traduit par aucun retrait du trend 
stochastique. 


14. Racines unitaires et regressions fallacieuses 

Comme nous l’avons vu, une racine unitaire dans un modele AR(1) 
correspond a un coefficient unitaire dans l’autoregression. Nous obte- 
nons alors une marche aleatoire reliee a 1’efficience des marches finan¬ 
ciers. Attardons-nous maintenant au probleme de racine unitaire dans 
une regression lineaire. Soit le modele de regression suivant: 

y t =a 0 +a l z t +e t 

ou l’on suppose que E(z t e t ) = 0. Les modeles oil les variables explica- 
tives sont stochastiques requierent qu’elles soient stationnaires. Mais 
si y t et z t sont non stationnaires, on pourrait etre confironte a une 
regression fallacieuse (spurious regression). Une telle regression n’a 
aucune valeur. Elle presente les symptomes suivants: 1) une faible 
Durbin-Watson; 2) un R 2 eleve; 3) des statistiques t significatives. 
Les resultats pourraient paraitre acceptables a prime abord mais 
l’estimateur des MCO est alors non convergent et les tests statistiques 
usuels sont non valables. Par exemple, Granger et Newbold (1974) 
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relatent des regressions qu’ils ont effectuees sur des variables suivant 
chacune une marche aleatoire et ont pourtant obtenu un R 2 important 
meme si ces deux processus n’ont apparemment aucun lien entre eux. 

Considerons maintenant tour a tour quatre cas d’espece ayant 
trait a deux series chronologiques y t et z t : 1) les series y t et z t sont 
stationnaires; 2) les deux series sont integrees de differents ordres; 
3) les deux series sont non stationnaires mais integrees du meme 
ordre; les residus emmagasinent un trend stochastique; 4) les deux 
series sont integrees du meme ordre et les residus sont stationnaires. 

Examinons d’abord le premier cas. Quand les deux series sont 
stationnaires, alors les MCO peuvent etre utilisees. Pour ce qui con- 
cerne le second cas, soit celui ou les series ont des ordres d’integration 
differents, la regression par les MCO n’a aucune valeur. Pour fixer les 
idees, analysons la regression suivante: 

y t =ajz t +e t 

ou Zt obeit au processus AR(1) suivant: 

z t = pz t _t +£ t 

et y t suit la marche aleatoire suivante: 

y t =y t -i+ v t 

Les residus e t de cette regression peuvent etre ecrits sous la forme 
suivante: 


e t =L v t-i-ai^p 1 e t _ i 

i=0 i=0 

Dans cette equation, la premiere somme ne converge pas alors que la 
deuxieme somme converge en supposant que | p | < 1. On en conclut 
que e t n’est pas stationnaire: cette regression n’a done aucune valeur. 

Passons maintenant au troisieme cas, soit celui de deux series 
non stationnaires mais integrees du meme ordre et ou les residus 
incorporent un trend stochastique. Dans un pareil cas, l’application 
des MCO a 1’equation reliant y t a z t se traduira par une regression 
fallacieuse. II est alors recommande de differencier les deux series: 


Ay t = ajAz t + Ae t 
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y t =y t -i+v t 

z t = z t-i +bt 

e t =e t -i+C t 

Finalement, dans le quatrieme cas, les series sont integrees du 
meme ordre et les residus sont censes stationnaires. Dans ce cas, on 
dit que les deux series sont cointegrees. L’estimateur des MCO pour 
la regression de y sur z est alors convergent 22 . Les series cointegrees 
sont reliees entre elles par un equilibre de long terme. Par exemple, 
on a constate que les taux d’interet sont des series cointegrees en vertu 
des theories de la structure a terme des taux d’interet. Incidemment 
Wilmott 23 voit la cointegration comme une mesure de correlation. 


15. Tests de racine unitaire 

Dans cette section, nous portons notre attention sur deux tests prin- 
cipaux: le test de Dickey-Fuller et le test de Dickey-Fuller augmente. 
II existe egalement le test de Perron, dont nous ferons une breve 
mention. 

Pour tester la presence d’une racine unitaire, on utilise le test du 
a Dickey-Fuller et publie en 1979. Ces auteurs se basent sur les regres¬ 
sions suivantes, qui sont des transformations du modele autoregressif 

AR(1): 


A y t = Yy t -i + e t 
A y t = a o +iy t -i +e t 

Ay t =a 0 +a 1 t + yy t _ 1 +e t 

Les differences entre ces trois equations sont evidentes. Par 
rapport a la premiere, un drift a ete ajoute dans la seconde et la 
troisieme comporte en plus un trend. Le test de racine unitaire est le 


22. Notons que l’estimateur est meme super-convergent. 

23. Wilmott (1998), op. cit. 
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suivant. Sous HO, 7 = 0, ce qui correspond a une racine unitaire 
puisque y = p -1. On effectue le test de racine unitaire en effectuant 
le test t standard: 



Selon cette derniere equation, sous HO, la statistique t n’a pas sa 
distibution habituelle. Elle obeit plutot a une distribution calculee par 
Dickey-Fuller, nommee t. Les valeurs critiques respectives de t pour 
les trois equations pour des seuils de 1 % a 10 % sont reportees au 
tableau 9.2. 


Tableau 9.2 Valeurs critiques asymptotiques pour les tests 
de racine unitaire 


Statistique du test 

1% 

2,5 % 

5% 

10% 

T sc 

-2,56 

-2,23 

-1,94 

-1,62 

T c 

-3,43 

-3,12 

-2,86 

-2,57 

Tct 

-3,96 

-3,66 

-3,41 

-3,13 


Source: Davidson, R. et J.G. McKinnon (1993), Estimation and Inference in 
Econometrics. Oxford University Press, New York. 


A titre d’exemple, si l’on applique le test Dickey-Fuller a la 
troisieme regression, on rejettera Phypothese nulle pour un seuil 
a = 5 % si la statistique t de 7 est superieure au T ct qui est egal en 
valeur absolue a 3,41. Cela indiquerait l’absence d’une racine unitaire 
au niveau a = 5 %. 

Envisageons maintenant le test Dickey-Fuller elargi publie en 
1981, abrege par ADF 24 . Pour construire ce test, on effectue la regres¬ 
sion suivante: 

p 

Ay t =a 0 +a t t + a 2 t 2 + ... + a n t n +yy t _j + J^PiAy t _ i+1 +e t 

i=2 

Fa version elargie du test de Dickey-Fuller comporte done des retards 
additionnels sur la variable Ay. Cet ajout vise a prendre en compte la 


24. ADF est I’abreviation de Augmented Dickey-Fuller. 
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presence eventuelle ^autocorrelation dans les residus. Dans la pratique, 
on se limite au cas pour lequel n = 1 et p = 2. II en resulte: 

Ay t = a 0 + a t t + 7y t _! + (3 2 Ay t _ 1 + e t 
Les hypotheses testees sont: 

HO :y = 0 


contre: 


HI: y^O 

ou y = p -1. On rejette HO si la valeur absolue de t est superieure a 
T ct . Sous HO, la distribution asymptotique du test t associee a cette 
regression est la meme que celle du test DF presentee precedemment. 
On peut aussi recourir a cette derniere regression pour tester si la 
serie financiere est TS ou DS de la fagon suivante. On calcule les 
statistiques t associees aux parametres y et ai. Si ces coefficients sont 
statistiquement differents de zero, on est presence d’une serie TS. Par 
ailleurs, si le coefficient y n’est pas significativement different de 0, 
alors la serie est DS, ce qui implique que p est alors egal a 1. Ce test 
est cependant plus ou moins rigoureux. 

Phillips et Perron (1988) ont propose une generalisation des tests 
Dickey-Fuller qui impose moins de restrictions sur la distribution des 
termes d’erreur. Plus precisement, Dickey et Fuller supposaient que 
les residus de leurs regressions etaient independants et de distribution 
homogene. Le test Phillips-Perron suppose seulement que les residus 
sont faiblement dependants et qu’ils peuvent etre distribues de fagon 
heterogene. La regression qu’ils proposent est la suivante: 

y t =P + ^^y^ + ay t -i+e t 

ou t = 1, ...,T. Sous HO, les donnees sont generees par: 

y t =y t -i+ e t 

soit une marche aleatoire ou E(e,) = 0. Perron et Phillips ont modifie 
les statistiques t de Dickey-Fuller pour prendre en compte 1’heteroge- 
neite des termes d’erreur. II faut calculer les statistiques t l± , tc, et tp qui 
sont les tests t usuels pour 1’hypothese nulle: p = 0, a = 1 et (3 = 0. Par 
la suite, il suffit simplement de calculer les statistiques de Perron- 
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Phillips associees a ces trois tests. Les valeurs critiques de ces statis- 
tiques de Perron-Phillips sont identiques a celles qui apparaissent 
dans la table de Dickey-Fuller. Pour plus de details a ce sujet, on 
consultera Enders (1995) 25 . Par la suite, Perron (1989) a elargi le test 
de racine unitaire au cas des changements structurels. II considere 
l’hypothese d’un seul sursaut dans le niveau du processus de racine 
unitaire contre 1’alternative d’un changement au niveau du terme 
constant d’un processus TS. 


16. Cointegration 

La cointegration se rattache a la correlation de deux series dans le 
temps. On dit que deux series y t et x t sont cointegrees si les residus de 
la regression de y t sur x t sont stationnaires : 

y t = a + (3x t + e t 

Par exemple, si y t et x t sont integrees d’ordre 1 et si e t est integree 
d’ordre 0, on a cointegration des deux series. Dans ce cas, meme si les 
deux series sont non stationnaires, la regression par les MCO ne sera 
pas fallacieuse en autant que les dites series soient cointegres. L’une 
des implications est la suivante. Si les series ne sont pas stationnaires, 
il n’est pas necessairement obligatoire de les stationnariser pour autant 
qu’elles soient cointegres. Par ailleurs, lorsque les series sont 
cointegrees, l’estimateur des MCO est super-convergent: |3 est alors 
un excellent estimateur de (3 puisque lorsque les deux series sont 
cointegrees, Pestimateur des MCO converge plus rapidement qu’autre- 
ment. La regression par les MCO decrit alors un equilibre a long 
terme, soit un equihbre stationnaire entre y t et x t . 

Pour tester si y t et x t sont cointegrees, il suffit de recourir a un 
test de racine unitaire sur les residus, tel le test Dickey-Fuller. Les 
etapes du test tel que developpe par Engle et Granger (1987) 26 sont 
les suivantes : 1) on regresse y t sur x t : 

y t = a + (3x t + e t 


25. Enders, W. (1995), Applied Econometric Time-Series, John Wiley and Sons, New 
York 

26. Engle, R.F. et C.W.J. Granger (1987), «Cointegration and Error Correction: 
Representation, Estimation and Testing*-, Econometrica, 55, p. 251-276. 
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on en deduit e t ; 2) on calcule: 

Ae t = e t - e t _, 

et on regresse ensuite Ax t sur x t _i : 

Ae t = (p — !)£(_! + v t 
Ae t = p*e t _ 1 + v t 

3) on effectue le test bilateral suivant: 

HO : p = 1 ou p* = 0 
HI : p ^ 1 ou p* ^ 0 
Ce test est le test t habituel: 


Vw) 

4) on rejette HO si: |t| > |x c |. II est a noter que les valeurs critiques 
doivent etre recalculees puisque e t est le resultat d’une regression dans 
laquelle le vecteur de cointegration est lui-meme estime. Pour plus de 
details, voir Mills (1999) 27 . 

Application 

Pour illustrer les tests de racines unitaires et de cointegrations, consi- 
derons 1’exemple suivant. Cet exemple se fonde sur la relation entre le 
prix a terme et le prix au comptant d’un instrument financier. Nous 
abordons le cas de 1’acceptation bancaire 28 canadienne a trois mois et 
du contrat a terme ecrit sur cet instrument. Le contrat a terme sur 
1’acceptation bancaire se transige a la Bourse de Montreal et est 
designe par l’acronyme BAX. Theoriquement, il existe une relation 
stricte entre le prix au comptant d’un instrument financier et son prix 
a terme. Mais dans la pratique, les prix peuvent devier de cette rela¬ 
tion. II reste que ces deux categories de prix devraient etre des series 


27. Mills, T.C. (1999), The Econometric Modelling of Financial Time Series, 2 e edition, 
Cambridge University Press, p. 269. 

28. Une acceptation bancaire est un titre de financement a court terme emis par une 
entreprise et garanti par une banque. 
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cointegrees. Cette cointegration est d’ailleurs a la base de la couver- 
ture d’un portefeuille de titres a court terme par les BAX. N’etait la 
cointegration, la couverture serait impensable. Pour tester la 
cointegration entre ces deux series, nous appliquons une version du 
test de Engle et Granger qui, en meme temps, illustre bien le test de 
racine unitaire, ici la version Dickey-Fuller elargie. 

Dans un premier temps, nous regressons le prix au comptant (S) 
sur le prix a terme (F). Fes donnees sont journalieres et s’etirent du 
debut a la fin de 1997. Fes resultats de cette regression apparaissent au 
tableau 9.3. 

Tableau 9.3 


Dependent Variable: SER01 

Method: Least Squares 

Date: 10/03/00 Time: 13:08 

Sample: (ajusted): 1 250 

Included observations: 250 after adjusting endpoints 

Variable 

Coefficient 

Std. Error t-Statistic 

Prob. 

C 

76.30243 

0.116647 654.1325 

0.0000 

F 

0.236687 

0.001209 195.7090 

0.0000 

R-squared 

0.993567 

Mean dependent var 

99.13103 

Ajusted R-squared 

0.993541 

S.D. dependent var 

0.100913 

S.E. of regression 

0.008110 

Akaike info criterion 

-6.783403 

Sum squared resid 

0.016313 

Schwarz criterion 

-6.755231 

Log likelihood 

849.9254 

F-statistic 

38302.01 

Durbin-Watson stat 

1.828987 

Prob(F-statistic) 

0.000000 


Nous retenons les residus de cette regression et nous effectuons 
la regression auxiliaire suivante qui est en fait le test ADF: 

Ae t = c + p * l e^ + PjAe,^ + (3 * t + u t 
Fes resultats apparaissent au tableau 9.4. 
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Tableau 9.4 Augmented Dickey-Fuller Unit Root Test 
on RES 


ADF Test Statistic 

-8.668564 

1 % Critical Value* 

5 % Critical Value 

10 % Critical Value 

-3.9983 

-3.4292 

-3.1378 

* MacKinnon critical values for rejection of hypothesis of a unit root. 

Augmented Dickey-Fuller Test Equation 

Dependent Variable: D(RES) 

Method: Least Squares 

Date: 10/03/00 Time: 13:17 

Sample (ajusted): 3 250 

Included observations: 248 after adjusting endpoints 

Variable 

Coefficient 

Std. Error t-Statistic 

Prob. 

RES(-I) 

-0.740128 

0.085381 -8.668564 

0.0000 

D(RES(-1)) 

-0.191772 

0.063091 -3.039631 

0.0026 

C 

0.000404 

0.001021 0.395437 

0.6929 

@TREND(1) 

-2.98E-06 

7.07E-06 -0.422159 

0.6733 

R-squared 

0.479433 

Mean dependent var 

1.45E-05 

Ajusted R-squared 

0.473033 

S.D. dependent var 

0.010974 

S.E. of regression 

0.007966 

Akaike info criterion 

-6.811198 

Sum squared resid 

0.015485 

Schwarz criterion 

-6.754530 

Log likelihood 

848.5886 

F-statistic 

74.90664 

Durbin-Watson stat 

2.000846 

Prob(F-statistic) 

0.000000 


La statistique t associee a e t _, est egale a -8.66. Cette statistique 
doit etre comparee aux valeurs critiques asymptotiques pour les tests 
de cointegration. En effet, ces statistiques different des valeurs critiques 
habituelles des tests de racines unitaires. Un apergu de ces valeurs 
critiques est presente au tableau 9.5. 


Tart,fait 9.5 


Statistique 
du test 

1 % 

2,5 % 

5% 

10% 

97,5 % 

m = 2 

T c 

-3,90 

-3,59 

-3,34 

-3,04 

-0,30 

Tct 

-4,32 

-4,03 

-3,78 

-3,50 

-1,03 


Source: Davidson, R. etJ.G. MacKinnon (1993), op. cit. 
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Comme on peut le constater, la statistique t associee a e t _, 
depasse largement la valeur de T ct au seuil de 5 %, ce qui nous conforte 
dans notre attente d’une forte cointegration entre le prix au comptant 
et le prix a terme des acceptations bancaires. 

Revenons a la regression de S sur F. On constate que le coeffi¬ 
cient de regression associe a F est approximativement egal a 0,24. Or, 
cette information est tres importante pour une operation de couver- 
ture, car elle represente la valeur absolue du ratio de couverture (h): 



AF 


Ce ratio nous indique que pour chaque contrat detenu au comptant, 
il faut vendre 0,24 contrat a terme pour couvrir sa position. En effet, 
la relation qui relie le nombre de contrats a terme (NF) au nombre de 
contrats au comptant (NS) est la suivante: 

NF = -NS x — 29 
AF 


29. Pour plus de details, voir: Racicot, F.-E. et R. Theoret (2000), op. cit. 
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CHAPITRE 


10 

L'HETEROSCEDASTICITE 
CONDITIONNELLE (ARCH) 


Ce chapitre se penche sur une propriete de certaines series econo- 
miques ou financieres, a savoir que leur volatility ou leur variance se 
modifie dans le temps. Pour traiter ce probleme en econometric finan¬ 
cier furent introduits les modeles d’heteroscedasticite conditionnelle. 
Ces modeles sont relativement recents. Le principal instigateur est 
Engle (1982). Dans un article intitule «Autoregressive Conditional 
Heteroscedasticity with Estimate of the Variance of United Kingdom 
Inflations », paru dans Econometrica en 1982, Engle a propose le modele 
ARCH, soit l’acronyme de: AutoRegressive Conditional Heteroscedasticity. 
Bollerslev, dans un article paru dans 1986 dans le Journal of Econometrics 
et intitule « Generalized Autoregressive Conditional Heteroscedas¬ 
ticity », a presente une version generalisee du modele d’Engle: le 
GARCH. Toute une panoplie de versions plus sophistiquees de ce 
modele devait s’ensuivre. L’ensemble de ces modeles fait 1’objet de ce 
chapitre. 


1. Notions d'esperances conditionnelle 

ET NON conditionnelle; notions de variances 

CONDITIONNELLE ET NON CONDITIONNELLE 

Pour introduire ces notions, nous considerons un modele du taux 
d’interet a court terme. Pour ce faire, on recourt a un processus 
autoregressif AR(1) stationnaire: 

Yt =a 0 + a 1 y t _ 1 +e t 
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ou e t ~ WN(0, a 2 ). Dans cette equation, y t est la valeur du taux 
d’interet au temps t. Nous voulons prevoir y t+ i en utilisant l’esperance 
non conditionnelle. On precede comme suit: 

y t+ i =a 0 +aiy t +e t+I 
E (y t +i ) = a 0 + aiE(y t ) + E(e t+1 ) 

L’esperance non conditionnelle sert a calculer des previsions a long 
terme d’une variable, soit sa moyenne a long terme. Sachant par 
ailleurs que la moyenne d’une serie stationnaire est constante, on peut 
ecrire: 


E(y t+ i) = a 0 +a 1 E(y t ) 


puisque: 


E(e t ) = E(e t+1 ) = 0 Vt 

II en resulte que: 


E(y„,) = -^- 

1_a i 

C’est la l’esperance non conditionnelle de y t+ i. 

Nous nous interessons maintenant a la prevision a court terme 
de y t+ i. L’esperance conditionnelle nous donne alors une prevision 
superieure a l’esperance non conditionnelle. L’esperance condition¬ 
nelle prend en effet compte de toute l’information disponible jusqu’au 
temps t. Elle suppose que toutes les variables sont connues et fixees 
jusqu’a cette periode. On peut done ecrire 

E t (y t+ i) = a 0 +a 1 E t (y t ) + E t (e t+1 ) = a 0 +a x y t +0 

y t est en effet connu au temps t et n’est done pas aleatoire. Par ailleurs 
e t+ i est inconnu a la periode t. Son esperance conditionnelle est done 
nulle. 

Pour introduire les notions de variances conditionnelle et non 
conditionnelle, nous au recourons au processus autoregressif suivant: 

y t = Ay t _! +e t 
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ou e t ~ N^O, a 2 j. Nous supposons egalement que y est une serie 
stationnaire, c’est-a-dire que X est inferieur a 1. En vertu des calculs 
anterieurs nous pouvons ecrire la variance conditionnelle comme suit: 

V t (y t ) = E t [y t -E t (y t )] 2 =a 2 

Pour calculer la variance non conditionnelle, nous recourons a l’equa- 
tion qui relie y t au decalage de l’innovation. Pour etablir cette rela¬ 
tion, nous exprimons l’equation de y t comme suit: 

y t (l-XL) = e t 

ou L designe 1’operateur de retard. En multipliant les deux cotes de 
cette expression par (1 - XL) -1 , on obtient: 

y t =(l-XL)- 1 e t 

et en utilisant une propriete bien connue de 1’operateur de retard, on a: 

y t = £ t + + X “£ t _2 +... + X n £ t _ n n —> °° 

La variance non conditionnelle est done egale a: 

V(y t ) = a 2 (l + X 2 +X 4 +...) 

L’expression entre parentheses est une progression geometrique de 
raison X 2 . La variance non conditionnelle de y t se simplifie done 
comme suit: 


v(y t ) = 


i-x 2 


La variance non conditionnelle est done differente de la variance 
conditionnelle. 


2. L # heteroscedasticite conditionnelle et les faits 

Traditionnellement, l’heteroscedasticite etait associee aux donnees en 
coupe instantanee (cross sectional data), les series temporelles etant 
etudiees dans un contexte d’homoscedasticite. En analysant les donnees 
macroeconomiques, Engle (1982) et Cragg (1982) ont trouve que la 
variance, dans les series temporelles, etait moins stable qu’il n’etait 
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generalement suppose. Pour pallier a ce probleme dans son modele 
d’inflation, Engle a realise que les grandes et petites erreurs de previ¬ 
sion etaient groupees {clustered), ce qui suggerait une forme d’hetero- 
scedasticite dans laquelle la variance de 1’erreur de prevision depend 
de 1’importance de 1’erreur precedente. En examinant certaines series 
financieres comme les taux d’interet et les cours boursiers, on remarque 
le meme phenomene. On peut done dire que la variance de ces series 
est heteroscedastique dans le temps. 

Une autre caracteristique des series financieres est leur leptokur- 
ticite, ce qui les eloigne d’une distribution normale. Gourieroux 
(1992) 1 rapporte les coefficients de kurtosis de certains titres cotes en 
bourse ainsi que ceux de certains metaux. Tous comportent un coef¬ 
ficient plus eleve que celui qui est associe a la loi normale. Les titres 
auriferes ont meme un coefficient de 11,4, done tres eloigne de celui 
qui est associe a la loi normale, qui se situe a trois. Selon Gourieroux, 
les modeles ARCH sont de nature a modeliser la leptokurticite pre¬ 
sente dans les donnees financieres puisque si l’on calcule le coefficient 
de kurtosis associe au modele ARCH, on trouvera que celui-ci genere 
des coefficients superieurs a 3. 


3. Le modele ARCH 

On a le modele de regression suivant: 

y t =(3 T x t +e t 

ou x t n’est pas aleatoire et ou e t suit le processus suivant: 

1 -. 1/2 

e t = u t[ a o +a i e t-iJ 

ou a 0 > 0 et 0 < a, <1, ces hypotheses assurant une variance condi- 
tionnelle finie et non negative. On postule ici que u t ~N(0, 1) et 
E(u t e t _i) = 0. 

Calculons 1’esperance conditionnelle de l’innovation: 

E(e t | e t _],e t _ 2 ,...) = E[u t (a„ + ) 1/2 |e t _j,e t _ 2 ,...] 


1. Gourieroux, C. (1992), Modeles ARCH et applications financieres, Economica, Paris. 
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Designons par E t _i l’esperance conditionnelle a l’information dispo- 
nible jusqu’en t - 1 : on suppose alors que cette information est une 
donnee pour les fins de l’analyse. On peut done ecrire: 

E t _ 1 (e t ) = E t _ 1 [u t (a 0 +a 1 e^ 1 ) 1/2 ] 

= E t _! (u t )E t _! ((a 0 + a iet 2 _! ) 1/2 ) 

= 0 

Passons maintenant au calcul l’esperance non conditionnelle de l’inno- 
vation. 

E(e t ) = E[u t (a 0 +a 1 e 2 _ 1 ) 1/2 ] 

et puisque u t et e t _i sont independants : 

E(e t ) = E(u t )e((cc 0 + oc ie 2 _i ) 1/2 ) = 0 

Notons encore une fois que E(.), soit l’esperance non conditionnelle, 
sert a calculer une prevision a long terme associee a la moyenne. Par 
contre, E t _i(.), soit l’esperance conditionnelle, sert a calculer une pre¬ 
vision a court terme en utilisant l’information disponible jusqu’au 
temps t - 1 . 

La variance conditionnelle de l’innovation, identifiee par h t est 
egale a: 

h t = a 2 = vf%j 4 a j ? e t - tJ ™) = E(e 2 |e t _ 1 ,e t _ 2 ,...) 

= E t _i (u 2 (a 0 + oqejLj )) = E t _! (u 2 )E t _! (a 0 + oqe 2 .!) = 1 x (a 0 + oqe 2 .!) 
= (a 0 +a 1 e 2 _ 1 ) 

II est certes evident que: 

v (y t |y t -i > y t -2 >•••) = v(e t |e t _! ,e t _ 2 ,...) 

= a 0 d-o^e 2 .! = a 2 

Tel est le modele ARCH(l) propose par Engle en 1982. II est a noter 
que 1 ’on suppose que ao > 0 et 0 < ai < 1 , ceci pour obtenir une variance 
conditionnelle finie, c’est-a-dire s’assurer de la stationnarite du pro- 
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cessus et de la non-negativite de la variance conditionnelle. On pour- 
rait par ailleurs demontrer la superiority des previsions effectuees a 
partir de l’esperance conditionnelle, cela parce que l’erreur de previ¬ 
sion est alors inferieure a celle qui est associee a l’esperance non 
conditionnelle. En effet, comme nous l’avons demontre dans la sec¬ 
tion precedente, 1’erreur de prevision associee a l’esperance condi¬ 
tionnelle est de cr 2 et celle reliee a l’esperance non conditionnelle est 
a 2 

de -. Comme 0 < A. < 1, la variance conditionnelle est done infe- 

1-X 2 

rieure a la variance non conditionnelle. 


4. Estimation du modele ARCH 

Tel qu’il vient d’etre presente, le modele ARCH respecte les hypo¬ 
theses du modele classique des MCO. Ses parametres peuvent done 
etre estimes par la methode des MCO puisque la variance non condi¬ 
tionnelle n’est pas heteroscedastique: l’estimateur des MCO est alors 
efficace. On estimerait alors les parametres de la variance condition- 
nelle par une regression auxiliaire ou artificielle. Par contre, il existe 
un estimateur non lineaire qui prend en compte l’heteroscedasticite 
conditionnelle et qui est plus efficace asymptotiquement que les MCO. 
Cette methode, telle que preconisee par Engle (1982), est le maxi¬ 
mum de vraisemblance. Ecrivons cette fonction de vraisemblance en 
posant que e t ~N(0, n t 2 ) = N(0, ao + aie t _i 2 ). La densite conjointe des 
innovations est: 

T 

f (e ie2 ...e T |(3,a 0 ,a!) = (e t |(3,a 0 ,a!) 


1 

-II 

r e t -E(e t )' 

1 7 ex P 

V 27ta ? 

2 ! 

V , 


Pour passer a la densite conjointe des observations sur y, on utilise la 
transformation jacobienne suivante: 

f (yt) = f Ot 


d y t 
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On pourra verifier facilement que 


de t 

l d y t 


= 1. II s’ensuit: 


f(y t |P> a o> a i 





Ceci implique: 


T 

L(p,a 0 ,ai|yi,y 2 ,...,y T ) = n f (yt|P ) oco,ai) 


On recherche done les valeurs des parametres qui maximisent la pro¬ 
bability de generer l’echantillon observe. Elaborons la fonction de 
vraisemblance: 



Exprimons cette expression sous forme logarithmique: 


lnL = -lh2K-bn[£h,J-i£ ^ 


|i T x ,) 2 


ou h t = = a 0 +a 1 e(_ 1 . L’algorithme d’optimisation utilise pour 

solutionner cette equation a deja ete presente au chapitre 4. Enders 
(1995) montre comment on peut trouver les valeurs des parametres 
qui maximisent la fonction de vraisemblance en utilisant le logiciel 
RATS. Ce programme apparait au tableau 10.1. 
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Tart,fait 10.1 

NONLIN (3 ao «i 
FRML e = y - Px 
FRML h = ao + ai*£ t _i 2 

FRML LIKELIHOOD = - 0.5*[log(h t ) + (e t 2 /h,)] 

COMPUTE p = initial guess, ao = initial guess, ai = initial guess 
MAXIMISE(RECURSIVE) LIKELIHOOD 2 end 
Source: Enders (1995). 

Dans le langage EViews, la fonction de vraisemblance d’un modele de 
regression lineaire simple se formule comme au tableau 10.2. 

Tableau 10.2 

smpl 1 n 
logl fctvrai 

fctvrai.append @logl logll 
fctvrai.append res=y-c(l)-c(2)*x 

fctvrai.append logll=log(@dnorm(res/@sqrt(c(3)))) -log(c(3))/2 
fctvrai.ml(b, d) 


Pour elargir ce programme au modele ARCH, le lecteur n’aura qu’a 
ajouter une ligne qui definit le modele ARCH des residus de la 
regression et a introduire cette variable dans la fonction de vraisem¬ 
blance logll. 


5. Generalisation du modele ARCH 
5.1. Le modele ARCH(q) 

Le modele ARCH(l) ne comporte qu’un seul retard sur l’innovation 
elevee au carre, c’est-a-dire: 

Oj =h t =a 0 +a 1 ej_ 1 
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Par contre, dans le modele ARCH(q), q retards sont utilises: 

E t-i ( e ?) = o? = K = «o + a i e t-i + - + «q e t- q = a o + a ( L ) e ? 

De cette demiere equation, il resulte que l’on peut ecrire l’innovation 
comme suit: 


e t 


u t h- 



Pour avoir une variance conditionnelle finie et positive, on impose 
que ao>0 et que les racines caracteristiques du a(L) se situent a 
l’exterieur du cercle unitaire. 

Bollerslev (1986) 2 generalise le modele de Engle (1982) en per- 
mettant a la variance conditionnelle de suivre un processus ARMA(p, q). 
Le modele general GARCH(p, q) s’ecrit comme suit: 

q p 

h t = a 0 + ^a ; ej_j + ^ Yjh t _j = a 0 + a(L)e 2 + y(L)h t 

i=i j=i 

II est a noter que le modele GARCH(1, 1) approxime de tres pres un 
modele ARCH(q) pour un indice q assez eleve. Ce modele s’ecrit 
comme suit: 


h t = a 0 + o^e^j + Yih t -i 

La variance conditionnelle de l’innovation se calcule comme suit: 

V(e t |e t _ 1 ,e t _ 2 ,...) = h t = a 0 +a 1 e t 2 _ 1 + Yih t -i 

Pour s’assurer de la stationnarite du processus et du caractere fini de 
la variance conditionnelle, on impose aux trois parametres d’etre po- 
sitifs ainsi que la relation suivante : 04 + 71 < 1. Si 04 + yi = 1, on a le 
modele IGARCH(1, 1), soit le integrated GARCH. 

Soulignons finalement qu’un modele GARCH peut representer 
de fagon parcimonieuse un processus ARCH(q), par exemple, un 


2. Bollerslev, T. (1986), « Generalized Autoregressive Conditional Heteroscedas- 
tity », Journal of Econometrics, vol. 31, p. 307-327. 
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processus GARCH(1, 1) a pu se reveler une approximation parcimo- 
nieuse d’un processus ARCH(8). II en resulte moins de restrictions 
sur les parametres estimes. 

5.2. Le modele ARCH-M 

Ce modele, du a Engle, Lilien et Robins (1987) 3 , s’ecrit comme suit: 
y t = X t (3 + 8h t +e t 

Dans cette equation, e t obeit au modele GARCH suivant: 

f q p \ 1/2 

e t = a 0 +^a ; et_i+^Yjh t _j u t =h 3 /2 u t 

On voit que, dans ce modele, la moyenne de y t depend aussi de la 
variance conditionnelle. Cette classe de modeles se prete bien a l’ana- 
lyse des actifs financiers. Contrairement au CAPM classique, la prime 
de risque n’est pas ici consideree comme fixe mais devient plutot une 
fonction croissante de la variance conditionnelle des rendements de 
l’actif financier. Engle, Lilien et Robins se sont servis de ce modele 
pour modeliser l’ecart de rendement entre un actif a long terme et un 
actif a court terme. Leur equation est la suivante: 

y t = u t +e t = (3 + 8h t +e t 


y t = ecart de rendement entre un actif a long terme et celui d’un 
bon du Tresor; 

u t = prime de risque incorporee dans l’actif a long terme; 
e t = terme d’erreur. 


3. Engle, R., D. Lilien et R. Robins (1987), « Estimating Time Varying Risk Premia 
in the Term Structure : The ARCH-M Model», Econometrica, 55, p. 391-407. 
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5.3. Le modele EGARCH 

Le modele EGARCH (exponential GARCH), du a Nelson (1991) 4 , a 
ete developpe pour modeliser non seulement l’exces de leptokurticite 
mais aussi les effets asymetriques qu’ont les rendements sur la volati¬ 
lite. Dans la litterature, cet effet est appele: leverage effect. II s’agit 
d’une correlation negative entre les rendements presents et la volati¬ 
lite future. En effet, une baisse du rendement d’une action est associee 
a une diminution de la valeur marchande de l’avoir des actionnaires de 
l’entreprise qui l’a emise. II en resulte une hausse du levier de cette 
entreprise, soit le ratio de sa dette a l’equite. L’entreprise est alors 
pergue plus risquee sur le marche, ce qui augmente la volatilite future 
du rendement de cette action. La baisse du rendement de cette action 
exerce done un effet de levier sur sa volatilite future 5 . Le modele 
EGARCH(p, q) se formule comme suit: 

ln(h t ) = ln(a 2 ) = a 0 + ^ a i |<t>u t _i + 9(| u t-i _ E|u t _ ; || jj 
+£y j ln(a t 2 - j ) 

j=i 

ou u t ~NID(0, 1) et e t = u t h t 1/2 = u t ay On suppose ici que les condi¬ 
tions concernant la stationnarite du processus sont respectees. Expli- 
quons sommairement le deuxieme terme du logarithme de la variance 
conditionnelle. Rappelons auparavant que dans le modele GARCH 
classique, la volatilite depend de l’importance des chocs sur l’innova- 
tion e t et non de leur signe. Cela neglige le leverage effect present dans 
les series financieres. Le modele EGARCH le prend en compte par le 
biais du deuxieme terme de son equation. Contrairement au modele 
GARCH, le modele EGARCH n’impose aucune contrainte de non- 
negativite sur les parametres a, et yj de fagon a s’assurer que la variance 
conditionnelle soit positive. Toutefois, comme cela a ete specific aupa¬ 
ravant, le processus est suppose stationnaire. 


4. Nelson, D.B. (1991), « Conditional Heteroskedasticity in Asset Returns: A New 
Approach», Econometrica, 59, p. 347-370. 

5. Pour plus de details sur ce sujet, on consultera: Bollerslev, T., R.Y. Chou et 
K.F. Kroner (1992), «ARCH Modelling in Finance : A Review of the Theory 
and Empirical Evidence », Journal of Econotnetrics, 52, p. 55-59. 
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Void comment le modele EGARCH integre le leverage effect. Si 
aj<]> < 0, alors la variance conditionnelle (a t 2 ) tend a augmenter (dimi- 
nuer) si e t _i est negatif (positif), ceci en conformite avec les faits 
empiriques qui font apparaitre le leverage effect au niveau du compor- 
tement des rendements des actifs financiers. 


5.4. Le modele TARCH 

Le modele TARCH (threshold ARCH), du a Zakoian (1994) 6 s’ecrit 
comme suit: 

y t = p T x t +e t 

La variance conditionnelle de l’innovation s’ecrit comme suit a l’inte- 
rieur de modele: 

a 2 = co + ae 2 _, +ye 2 _ 1 d t _ 1 +(3a 2 _, 

ou d t = 1 si e t < 0 (mauvaise nouvelle) et 0 autrement. Ce modele 
veut integrer l’observation suivante sur les series temporelles des ren¬ 
dements financiers. En effet, on a remarque que les mauvaises nouvelles 
affectent davantage la volatilite que les bonnes. Si y est significati- 
vement positif, il y aura alors evidence de la presence d’un tel pheno- 
mene. 

Les modeles GARCH ont trouve de multiples applications en 
finance moderne. En plus de celle reliee au CAPM que nous relate- 
rons dans la section « Applications », d’autres chercheurs les ont trans¬ 
poses a la theorie des options, la ou la volatilite joue un role primordial 7 . 


5.5. Prevision a partir du modele GARCH 

On pourrait montrer que le modele GARCH(1,1) revient a prevoir y t 
a partir de la moyenne ponderee, a poids geometriquement decrois- 


6. Zakoian, J.M. (1994), « Threshold Heteroskedastic Models », Journal of Economic 
Dynamics and Control, 18, p. 931-955. 

7. Voir a cet effet: Engle, R. et C. Moustafa (1992), «Implied ARCH models from 
Options Prices », Journal of Econometrics, 52, p. 289-311; Duan, J.C. (1995), 
«The GARCH Option Pricing Model», Mathematical Finance, 5, p. 13-32. Pour 
une synthese des articles dans le domaine des modeles GARCH, voir: Racicot, 
F.E. (2000), Notes on Nonlinear Dynamics, op. cit. 
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sants, des retards sur l’innovation au carre. Cela revient presque alors 
a un modele MA ou la variable independante est l’innovation au carre. 
Pour le montrer, supposons le modele GARCH(1, 1) suivant: 

o 2 = co + ae 2 ^ + Pa 2 _i 
Par substitution repetee de a 2 _ i; on obtient: 

a 2 = co + |3co + p 2 co +... + ae 2 _! + aPe 2 _ 2 + ap 2 e 2 _ 3 +... 

On voit que les poids appliques par a e 2 _; sont ap 1_1 . Les poids 
diminuent done au taux exponentiel p. 

Cette methode est plus satisfaisante puisque notre objectif est ici 
d’effectuer le monitoring de la volatilite actuelle. II est done approprie 
de dormer davantage de poids aux observations plus recentes pour 
calculer la volatilite. Tel n’est pas le cas pour la variance classique qui 
donne un poids de 1/(T - 1) a toutes les observations. 

Nous voulons maintenant prevoir la volatilite conditionnelle 
d’une serie a partir d’un modele GARCH(1, 1). Soit: 

a 2 = a 0 + a 1 e 2 _ 1 + Pa 2 _i 

Nous voulons prevoir dans un premier temps a 2 +1 - On a: 

E t (a 2 +1 ) = a 0 + a l E t (e 2 ) + pE t (a 2 ) = a 0 + a 2 (a t + p) 

La prevision de la variance conditionnelle dans deux periodes peut 
s’ecrire comme suit: 

E t (°?+2) = a 0 + «iE t (a 2 +1 ) + pE t (a 2 +1 ) = a 0 + (a 3 + p)E t (a 2 +1 ) 
En substituant dans cette equation la valeur deja trouvee pour a 2 +1 , 

E t (a 2 +2 ) = a 0 (1 + a t + p) + a 2 (aj + p) 2 
On peut reecrire cette expression comme suit: 


E t (a 2 +2 ) 


(l + cx t +p)(l-a 1 ~p) ^ 

(1-oti-p) 


a t ( a i +P ) 2 


l~(«i +P ) 2 

1 — aj — p 


a 0 +a 2 (a! +p) 2 
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Finalement, la prevision dans n periodes de la variance conditionnelle 
se calcule en remplagant simplement l’exposant 2 dans 1’expression 
precedente par l’exposant n: 


l-( a i + P)” 
1-OCi-P 


a o + G t ( a l +P) n 


l-a x -p 1-ocj-p 


- + Ot (aj +p) n 


1-o^-p 


+ (a 1 +p) n a\- 


Cette demiere equation peut etre utilisee pour calculer des previsions 
pour n’importe lequel horizon en fixant n a l’horizon desire. Quand 
aj + P = 1, l’esperance conditionnelle de la volatilite se simplifie pour 
devenir: 


E t (<Jt+ n ) = a t +na 0 

Le modele GARCH(1, 1) pour lequel a, + P = 1 comporte une racine 
unitaire de telle sorte que la volatilite presente affecte les previsions de 
volatilite dans un futur indefini. On est alors en presence du GARCH 
dit integre, encore designe par IGARCH(1, 1). Pour des GARCH 
d’ordres superieurs: GARCH(p, q), des previsions sur de multiples 
periodes peuvent etre effectuees de fagon similaire. 

5.6. Test ARCH 

Pour tester la presence d’erreurs de type ARCH dans le modele 
suivant: 


y t = x t P + e t 

on peut effectuer le test LM propose par Engle (1982). Les etapes du 
ce test sont les suivantes: 

1) On estime d’abord Pequation precedente par les MCO. 


© 2001 - Presses de l’Universite du Quebec 

Edifice Delta T.2W5, boal. limner, bureau 450, Oafixsc, Qnibec G1V 2M2 • TCI (418) 657^399 - www paq ca 

Tird : Traite d'econometrie financiere, Frangois-Eric Racicot et Raymond Thdoret, ISBN 2-7605-1123-5 • D1123N 








L’heteroscedasticite conditionnelle (ARCH) 287 


2) Les residus estimes de la regression precedente sont alors 
eleves au carre: 


S^=(y t -x t p) 2 

3) On effectue la regression artificielle suivante: 
e t 2 = a 0 + + - + a q e 2 _ q + u t 

On se sert du R 2 de cette regression pour effectuer le test. En effet, la 
statistique (t x R 2 j —> % 2 (q)- S’il n’y a pas d’effet ARCH, le R 2 de la 
regression artificielle sera faible. La statistique (T X R 2 ) se situera 
alors sous la valeur critique de la distribution \ 2 - L’hypothese HO, a 
l’effet de l’absence d’effet ARCH, se formule comme suit: 

HO: a x = a 2 =... = a q = 0 

On rejettera HO si (T X R 2 ) > y 2 . Par exemple, on rejettera l’hypo¬ 
these de l’absence de l’effet ARCH(l) si TxR 2 > % 2 (1) = 3,84. 


Application 

Dans cette section, nous coulons le CAPM dans le creuset de la 
methode d’estimation dite GARCH-M (GARCH-in-Mean) 8 . Mais 
auparavant, forts des concepts que nous avons introduits depuis que 
nous avons examine le CAPM, nous reconsiderons l’estimation de ce 
modele par la methode des MCO. 

Les hypotheses du CAPM sont au nombre de cinq: 1) les inves- 
tisseurs eprouvent de l’aversion pour le risque; 2) leurs attentes sont 
homogenes au plan des rendements, ce qui signifie qu’ils prevoient la 
meme matrice variance-covariance des rendements qui sont censes 
obeir a une distribution normale; 3) il existe un actif sans risque; 

4) 1’information est gratuite; 5) il n’existe aucune imperfection de 
marche. Entre autres, il n’existe pas d’impots ou de restrictions sur les 
ventes a decouvert. 


8. Par association au modele ARCH-M presente auparavant dans ce chapitre. 
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Le modele du CAPM comprend grosso modo deux equations. 
La premiere est la CML (Capital Market Line ) et la seconde, la SML 
{Security Market Line). Considerons ces deux relations tour a tour. 


La CML 

La CML est une equation qui relie, lorsque l’equilibre sur les marches 
financiers est atteint, les rendements des portefeuilles dits efficients 9 . 
L’equation de la CML s’ecrit comme suit: 



ou E(R p ) represente la valeur esperee du portefeuille p; Rf, le taux 
sans risque; E(R m ), la valeur esperee du rendement du portefeuille du 
marche; a m , l’ecart-type du rendement du portefeuille du marche et 
Up, l’ecart-type du rendement du portefeuille p. La representation 
graphique de la CML apparait a la figure 10.1. 

[ e(r )—R 1 

—-——-- . Elle represente 

J 

le prix du risque. C’est le rendement excedentaire 10 du portefeuille du 
marche par unite de risque, ici mesure par I’ecart-type du rendement 
du portefeuille du marche. Ce prix est commun a tous les porte¬ 
feuilles. Ce qui differe d’un portefeuille a l’autre, c’est la quantite de 
risque qui y est emmagasinee, mesuree par cr p . 

On 1’aura constate a la lecture de la figure 10.1, les portefeuilles 
efficients sont de simples combinaisons lineaires de 1’actif sans risque 
et du portefeuille du marche. Entre les points Rf et M, les investis- 
seurs detiennent pour partie 1’actif sans risque et pour partie le porte- 


9. Un portefeuille est dit efficient s’il ne comporte pas de risque non systematique, 
dit encore risque residuel ou non relie au risque presente par le portefeuille du 
marche. 

10. C’est-a-dire le rendement au-dela du taux sans risque que les investisseurs exigent 
pour supporter le risque incorpore dans le portefeuille du marche. 
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feuille du marche. Au-dela de M, les investisseurs ont vendu a decou- 
vert l’actif sans risque, c’est-a-dire qu’ils ont emprante de maniere a 
investir davantage dans le portefeuille du marche. 


Figure 10-1 La CML 



La CML aboutit done au phenomene dit de la separation de 
portefeuilles. En effet, en vertu de la CML, les investisseurs n’exer- 
cent leurs choix que sur deux categories d’actifs ou fonds: le fonds 
constitue par l’actif sans risque et le fonds constitue par le portefeuille 
du marche. Tout investisseur detient done les actifs risques dans les 
memes proportions, qui sont egales aux ponderations que revetent ces 
actifs dans le portefeuille du marche, et cela quel que soit le niveau de 
son degre diversion au risque. Ce qui differe d’un individu a l’autre, 
ce sont les ponderations respectives qu’il accorde au fonds sans risque 
(actif sans risque) et au fonds risque (portefeuille de marche). Ces 
ponderations sont determinees par son degre diversion au risque. 
Plus un individu craint le risque, plus il donnera la part belle au fonds 
sans risque dans son portefeuille. 
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La SML 

La SML est une relation d’equilibre entre le rendement d’un titre (ou 
d’un portefeuille) et son beta respectif. Pour la deriver, nous nous 
reportons a la figure 10.2. 


FIGURE 10.2 Derivation de la SML 



Supposons qu’un portefeuille soit compose de a% d’un actif 
risque i et de (l-a)% du portefeuille du marche M. La frontiere 
efficiente representee par la courbe RMR sur la figure 10.2 fournit 
ces combinaisons rendement-risque de 1’actif i et du portefeuille du 
marche M. Or, l’equilibre des marches financiers ne peut se situer 
qu’au point M. En effet, 1’actif i a deja sa ponderation d’equilibre au 
sein du portefeuille du marche. La proportion a n’est done qu’une 
demande excedentaire qui prend une valeur nulle lorsque l’equilibre 
sur les marches financiers est atteint. 

Au point M, il y a egalite entre les pentes de la CML et de la 
frontiere RMR. Pour deriver la SML, soit la relation d’equilibre 
entre l’esperance du rendement d’un titre et son risque, nous devons 
done egaler les pentes de la CML et de RMR au point a = 0. Nous 
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savons que la pente de la CML est de: ^ --. Par ailleurs, la 

a m 

3E(r )/3a 

pente de R'MR est de: —1——-La SML doit done satisfaire a 

3a(R p )/3a 

l’egalite suivante des pentes: 

E(R m )-R f 3E(R p )/3a 


’ 3a(R p )/3a 


Nous devons effectuer les deux derivees qui apparaissent a droite de 
cette equation. Effectuons d’abord la derivee qui apparait au numera- 
teur pour ensuite passer a la derivee presente au denominateur. Nous 
savons que: 

E(R p ) = aE(R 1 ) + (l-a)E(R m ) 

La derivee du numerateur est done de: 


3 e ( r p) 

3a 


= E(Ri)-E(R m ) 


Passons maintenant a la derivee presente au denominateur du terme 
de droite de l’egalite des pentes. Nous savons que: 

a(R p ) = pa 1 2 +(l-a) 2 a^+2a(l-a)a im j 


Nous devons deriver cette expression par rapport a a. Pour ce faire, 
nous recourons a la regie de la chaine. Representons par y le terme 
entre crochets dans cette equation. On a done: 


°( R p) = y 1 ' 


La regie de la chaine est done, dans le cas qui nous interesse: 
3a p _ 3a p 3y 
3a 3y 3a 
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On peut ecrire: 

30p 1 

3a 

Et, en remplagant y par sa valeur 11 
_ 1 
3a 2 


2 3a 


^ = i[a 2 a 1 2 +( 1 -a) 2 ai+2a(l-a)a im ] 
[2aa 2 -2+ 2aa^ +2a im -4aa im ] 


Cette derivee doit etre evaluee au point a = 0, soit a l’equilibre des 
marches financiers: 


3a 


-2a' +2(5^ =- 


En substituant ces derivees dans l’expression de l’egalite des pentes de 
la CML et de R'MR, on obtient finalement: 


E(R m )-R f 3E(R p )/3a 


E(R m )-R f E(R 1 )-E(R m ) 


E ( R m 


-(a im -a 2 m ) = E(R ; )-E(R m ) 
[E(R m ) - R f - E(R m ) + R f = E(R ; ) - E(R m ) 


11. A remarquer que l’on recourt egalement a la regie de la chaine pour deriver 
(l - a) par rapport a a. On pose (1 - a) = y. La regie de la chaine devient dans 
do^y dy 7 

ce cas:-= 2yo m x-l. En remplafant y par sa valeur, on obtient 

dy da 

finalement: -2(l-a)o^ = -2o^ +2act^. 
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A l’equilibre, l’esperance du rendement du titre i est egale a: 

E(R,) = R ( +[ E (R m )-R f ]^ 

Definissons comme suit le beta du titre i, soit son risque systematique: 



On obtient 1’expression finale de la SML: 

E(R I ) = R f +[E(R m )-R f ](3 1 

En situation d’equilibre sur les marches financiers, il existe par conse¬ 
quent une relation lineaire entre le rendement espere d’un titre et son 
risque systematique, represente par son beta 12 . La representation gra- 
phique de la SML apparait a la figure 10.3. 


Figure 10.3 La SML 



12. Pour un titre particulier, l’ecart-type de son rendement est une mesure inade¬ 
quate de son risque puisque cette mestire comporte tine part de risque non syste¬ 
matique. Or, les marches financiers ne remunerent que le risque systematique. 
Le beta d’un titre, qui est une mesure du risque systematique d’un titre, fait done 
figure de mesure plus appropriee de son risque. 
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On constate que le modele du CAPM a beaucoup emprunte a la 
theorie de Markowitz ayant trait a la diversification de portefeuille. La 
mesure pertinente du risque d’un titre est la covariance entre son ren- 
dement et celui du portefeuille du marche, tout comme chez Markowitz 
la mesure pertinente du risque est la covariance entre son rendement 
et ceux des autres titres qui constituent un portefeuille. En formulant 
le CAPM, Sharpe a simplifie la matrice variance-covariance des ren- 
dements des titres en reliant le rendement d’un titre a celui du porte¬ 
feuille du marche et non a celui de chacun des titres du portefeuille. 
Mais le message est le meme. Le marche ne remunerera que le risque 
non diversifiable, qui est mesure par la covariance entre les rende- 
ments des titres. Le risque diversifiable est dilue dans un portefeuille 
bien diversifie et ne sera pas remunere sur des marches financiers 
efficients. 


Relation entre le beta et la variance du rendement d'un titre 


Pour etablir la relation entre le beta d’un titre et la variance de son 
rendement, nous recourons au modele du marche, qui relie, au plan 
empirique, le rendement d’un titre a celui du portefeuille du marche: 

R-it = (X; + (3jR mt + £; t 

ou Rj t est le rendement du titre i au temps t; R mt , celui du portefeuille 
du marche et e it , le terme d’erreur de la regression. II est postule que: 
E(R mt ,e it ) = 0 , c’est-a-dire que le rendement du portefeuille du mar¬ 
che est independant de l’innovation 13 . L’estimateur des MCO de Pi 
correspond bien a la definition theorique du beta d’un titre puisque la 
methode des MCO donne au beta la valeur suivante: 


Cov(R ; ,R m ) 
Var(R m ) 


13. Nous omettons l’indice t par la suite pour alleger la presentation. 
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C’est pourquoi on recourt generalement au modele du marche pour 
calculer le beta d’un titre 14 . Calculons, a partir de cette equation, la 
variance du rendement du titre i. L’input a ce calcul est l’esperance de 
Ri, qui est egale a: 

E(R i ) = a i +(3iE(R m ) 

La variance de R; est done egale a: 

E[Ri -E(R ; )] 2 =E[ai +(3 i R m + e i -a; -(3 ; E(R m )] 2 
= E[(3 1 (R m -E(R m )) + e I ] 2 
= E|(3 1 2 E[R m - E(R m )] 2 + 2pi [R m - E(R m )]e i + e 2 1 
= (3 2 E[R m -E(R m )] 2 +E(e 2 ) 

puisque R m et £j sont supposes independants. II suit que: 

a 2 =(3 2 a 2 m +a 2 Ei 

Cette equation indique que le risque total d’un titre comprend deux 
composantes: le risque systematique, qui est relie a la variance du 
portefeuille du marche et au beta du titre, et le risque non systema¬ 
tique, qui est idiosyncratique au titre en question. Le risque systema¬ 
tique est orthogonal au risque non systematique. La representation 
graphique de cette orthogonalite apparait a la figure 10.4 qui n’est 
rien d’autre qu’une application du celebre theoreme de Pythagore. 


14. Attention. Le modele du marche ne repose sur aucune theorie particuliere. Ce 
n’est pas a proprement parler la version empirique du CAPM, meme si on 
recourt la plupart du temps au modele du marche pour calculer le beta. II y a en 
effet deux autres modeles qui sont egalement utilises dans les tests du CAPM. Le 
premier est a proprement parler la version empirique du CAPM. Nous le presen- 
tons dans la section qui suit. L’equation empirique de ce modele est la suivante: 
R it = R ft +Pi[R mt -R ft ] + e it . Le second est la ligne empirique du marche 
{empirical market line). Son equation est la suivante: R it = y 0t + y u (3 jt +e it - Pour 
plus de details a ce sujet, on consultera: Copeland, T.E. etJ.F. Weston (1988), 
Financial Theory and Corporate Policy, Addison-Wesley, New York, chap. 6, chap. 7 
et chap. 10. 
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Figure 10.4 



Un portefeuille efficient ne comporte pas de risque residuel. En 
vertu de la formule qui vient d’etre etablie, sa variance s’ecrit comme 
suit: 


Le beta d’un portefeuille efficient est done de: 



a m 


soit le simple ratio des ecart-types respectifs des rendements du por¬ 
tefeuille p et du portefeuille du marche. Une autre fagon d’arriver a ce 
resultat est d’ecrire le beta en termes du coefficient de correlation 
entre le rendement du portefeuille p et celui du portefeuille du marche, 
soit p pm : 


Pp=P pm 


a m 


© 2001 - Presses de l’Universite du Quebec 

Edifice U Delta T.2W5, boat limner, bureau 450, Quebec, Quebec G1V 2M2 • TCI (418) 657-4399 - www pug ca 

Tird : Traite d'econometrie financiere, Frangois-Eric Racicot et Raymond Thdoret, ISBN 2-7605-1123-5 • D1123N 







L’heteroscedasticite conditionnelle (ARCH) 297 


Comme la correlation entre le rendement d’un portefeuille efficient 
et celui du portefeuille du marche est de 1, on retrouve le resultat 
precedent: 



a m a m 


Le modele du marche donne lieu a une expression relativement 
simple pour la covariance entre les rendements des titres i et j. Par 
definition, cette covariance est egale a: 

CT i) = E { [R, -E(R,)] [R| -E(R,)] } 

En remplagant Rj, Rj, E(Rj) et E(Rj) par leurs valeurs respectives dans 
le modele du marche, on obtient: 

=e{ [p,( R m -E(R m ))+e,][p i (R m -E(R m ))+e,] } 

= E |Pi|5j[R„-E(R m )] 2 +P j [R„-E(R m )]E 1 
+(3 ; [R m -E(R m )]ej d-ejEj 

Comme E(R m ,e i ) = 0, E(R m ,£j ) = 0 et E(e, ,£j) = 0, on peut ecrire : 

Ojj = (3 i (3 j E[R m - E(R m )] 2 = pipjC^ 

Par consequent, pour calculer la covariance entre les rendements de 
deux titres, il suffit de connaitre les betas respectifs des deux titres et 
la variance du rendement du portefeuille du marche. Si un portefeuille 
comprend N titres, on n’a besoin que de (N + 1) donnees pour calcu¬ 
ler la matrice variance-covariance, en supposant qu’il n’existe pas de 
risque residuel 15 : les N betas des N titres et la variance du rendement 
du portefeuille du marche. Dans le cadre de la theorie de Markowitz, 
comme on ne relie pas le rendement d’un titre a celui du portefeuille 


15. En effet, comme on l’a vu precedemment, les variances des rendements des titres 
sont affectes par le risque residuel. Mais on peut supposer que celui-ci est dilue 
dans un portefeuille bien diversifie. 
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du marche, il faut calculer N variances et 


N 2 -N 


covariances 16 pour 


en arriver a construire la matrice variance-covariance. Dans le cadre 
du modele du marche, la matrice variance-covariance des rendements 
des titres s’ecrit done, pour un portefeuille compose de N titres, 
toujours en supposant la dilution du risque residuel: 


P1P2 


P2P! (3 2 


PiPn 

P 2 Pn 


PnPi p N p 2 ... p 2 N 


Cette matrice, a l’evidence symetrique, est done d’un calcul fort aise. 


Transposition de la theorie du CAPM 
au calcul des prix des actions 17 

La theorie du CAPM est formulee en termes de rendements esperes. 
Nous voulons maintenant la transposer a la determination des prix 
d’equilibre des titres. Nous nous situons dans le contexte d’une pe- 
riode, disons un an. Nous voulons determiner le prix d’un titre qui 
paiera dans un an un cash-flow-risque, designe par P e . Ce dernier est 
done une variable aleatoire. 



16. La matrice variance-covariance est en effet symetrique. 

17. Pour rediger cette section, nous nous inspirons de: Copeland et Weston (1988), 
op. cit., chap. 7, p. 202-203. 
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Pour ce faire, nous ecrivons la SML dans une forme ou apparait le 
prix du risque, designe par X. 


E(Rj) = R f 


[E(R m )-R f ] 


Cov(R j; R m ) 

Var(R m ) 


R f + XCov^Rj ,R m ) 


X est le rendement excedentaire du marche par unite de risque. On 
peut done 1’assimiler au prix du risque. Par ailleurs, le rendement du 
titre j est egal a: 

Po 


L’esperance du rendement du titre j est done de: 

/ \ E(P )-P 0 

E ( R i )= A iH L 

M) 

En substituant cette valeur dans le CAPM, on obtient: 


E ( Pe ) P ° =Rf +XCov(R j ,R m ) 


En mettant Po en evidence, on decrypte l’expression du prix d’equi- 
libre du titre j dans le contexte du modele du CAPM: 


Efc) 

1 + R f + XCov^Rj ,R m j 


Cette expression obeit a la forme generale de l’equation du prix d’un 
titre dans le contexte d’une periode, forme egale a: 


E(CF) 

1 + E(R.) 


ou P s est le prix d’un titre; E(CF), l’esperance du cash-flow qu’il 
paiera a la fin de la periode et E(R S ), le taux de rendement requis par 
les investisseurs pour detenir cet actif. Dans sa forme generale, ce taux 
est egal a: 

E(R S ) = Rf + prime de risque 
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Chaque modele donne une forme particuliere a la prime de risque. 
Dans le cadre du CAPM, l’equation anterieure indique que cette 
prime est egale a: ACov^Rj ,R m ), soitle produit du prix du risque par 
la quantite de risque du titre j, quantite mesuree par la covariance du 
rendement du titre j avec celui du portefeuille du marche. 

II existe une autre fagon de calculer le prix d’equilibre d’un actif 
risque dans le cadre du modele du CAPM qui fait appel cette fois-ci a 
la technique dite de Pequivalent-certain. Pour y arriver, il suffit d’ex- 
primer la covariance entre les rendements du titre j et du portefeuille 
du marche en termes du prix du titre j. On a done: 

Cov^Rj ,R m ) = Cov|^—-— ,R m j 


Par definition, cette covariance est egale a: 


.- e M 


Cette expression se simplifie comme suit: 

C Ov( R j, R m ) = ~ E { [ P e -E ( P e)] [ R m -E (Rjn)] } 
*0 

= —Cov(P e ,R m ) 

Pq 


II suffit maintenant de remplacer, dans la formule anterieure de Po, 
Cov(.) par cette valeur: 

P E W 

° 1 + R f + t(l/P 0 ) Cov(P e ,R m ) 

En mettant Po en evidence, on trouve finalement: 

n E (P e )-XCov(P e ,R m ) 

0= Ei; 
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C’est la l’expression finale du prix d’un titre en termes d’equivalent- 
certain. C’est-a-dire qu’au numerateur de cette formule, on calcule 
l’equivalent-certain de 1’esperance du cash-flow promis par le titre en 
lui soustrayant une prime de risque. Cette prime est egale au produit 
du prix du risque et de la quantite de risque du titre , quantite mesuree 
par la covariance entre le cash-flow aleatoire du titre et le rendement 
du portefeuille du marche. Apres prise en compte du risque du cash¬ 
flow au numerateur, on peut alors actualiser 1’esperance du cash-flow 
ainsi corrigee au taux sans risque. Au numerateur de Po, on a done 
retranche une penalite pour prendre en compte le risque que presente 
le cash-flow du titre analyse 18 . 


18. Dans la pratique, il est courant de relier le prix d’un titre a son beta respectif a 
l’aide de l’equation econometrique suivante: 

= a 0 +oq (PAYOUT); +a 2 (beta); +a 3 (EGR); +£; 

ou le ratio (P/E); represente le rapport cours-benefices de l’action, P etant son 
prix et E, le benefice par action; PAYOUT, le taux de paiement du dividende a 
la fin de l’annee de Pemetteur de l’action i; EGR, le taux de croissance des profits 
au cours des cinq dernieres annees de Pemetteur de Paction et beta, bien entendu 
le beta de Paction en cause. En fait, cette equation est une transposition du 
modele de Gordon au plan empirique. Cette regression est effectuee en coupe 
instantanee en recourant a diverses actions cotees en bourse. Lorsque l’on effectue 
cette regression, on s’attend a ce que le beta ait un signe negatif. En effet, plus 
le beta d’un titre est eleve, plus son risque est important, ce qui devrait se 
traduire par une baisse de son rapport cours-benefices ou par une hausse de 
l’inverse de ce rapport qui est une mesure du rendement du titre. Plus le risque 
d’un titre est important, plus son prix doit s’ajuster a la baisse pour inciter un 
investisseur qui eprouve de P aversion pour le risque a le detenir. Par ailleurs, 
dans cette equation EGR mesure la croissance anticipee des profits d’une com- 
pagnie qui est evaluee par la croissance observee de ceux-ci au cours des cinq 
dernieres annees. Certes, un tel indicateur des profits prevus peut se reveler 
inadequat. Quoi qu’il en soit, une hausse des profits anticipes devrait evidem- 
ment se traduire par une hausse du rapport cours-benefices. Une compagnie 
donnee, qui oeuvre disons dans le secteur de la biotechnologie, peut avoir un beta 
important mais quand meme jouir d’un (P/E) eleve si on anticipe une croissance 
marquee de ses profits au cours des prochaines annees, ce qui s’observe souvent 
dans le secteur de la biotechnologie. Finalement, le modele de Gordon indique 
que la variable taux de paiement da dividende devrait exercer un impact positif sur 
le rapport cours-benefices. Mais le recours a cette variable dans la pratique ne 
va pas sans failles, puisqu’elle peut etre porteuse d’effets de signalisation. 
Notons rapidement les limites d’une telle regression. Celle-ci postule d’abord 
une relation lineaire entre le rapport cours-benefices et ses facteurs explicatifs, ce 
qui n’est peut-etre pas le cas. Ensuite, l’analyse des residus peut signaler de 
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Comme on a pu le constater dans le chapitre 6, consacre aux 
methodes numeriques utilisees en econometric, Pactualisation au taux 
sans risque jourt d’une tres grande popularity dans le domaine de deva¬ 
luation des produits derives. Pour determiner le prix d’un produit 
derive, on calcule 1’esperance de ses cash-flows dans un univers neutre 
au risque. On peut alors actualiser lesdits cash-flows au taux sans risque 
pour en arriver a la determination du prix d’equilibre du produit derive. 
Nous envisageons maintenant l’estimation de la SML par la methode 
des MCO, en insistant sur les conditions qui doivent etre satisfaites 
pour que l’on puisse recourir a une telle methode d’estimation. 


L'estimation de la SML par la methode des MCO 

La SML est formulee en termes de rendements esperes. Or, ceux-ci 
ne sont pas directement observables. Pour arriver a exprimer la SML 
en termes de donnees observables, on suppose que le rendement d’un 
titre obeit a un jeu non biaise (fair game) 19 represente par le processus 
stochastique suivant: 

R it = E(R it ) + (3 ; [R mt - E(R mt )] + e it 

On remplace ensuite E(Rj t ) par son expression en termes de la SML et 
apres certaines manipulations evidentes, on obtient: 

R it - R ft =Pi[ R mt - R ft] + e it 


signaler de l’heteroscedasticite ou d’autres problemes statistiques. Cette analyse 
peut entre autres indiquer certaines transformations souhaitables des variables 
independantes (variables elevees au carre, transformation logarithmique et plus 
generalement transformation Box-Cox) qui sont de nature a mieux expliquer le 
rapport cours-benefices. La presence de multicollinearite, qui est frequente dans 
ce type de regression, diminue la fiabilite des coefficients estimes, pouvant meme 
se traduire par des signes contraires a ceux qui sont anticipes pour les differentes 
variables et par une forte instability dans l’estimation des coefficients d’une 
periode a l’autre. Pom plus de details stir ce type d’analyse empirique, on consul- 
tera: Damodaran, A., (1996), Investment Valuation , John Wiley & Sons, New 
York, chapitre 14. 

19. Pour plus de details a ce sujet, voir: Copeland, T.E. et J.E. Weston (1988), 
Financial Theory and Corporate Policy, Addison Wesley, New York, p. 212 et 
suivantes. 
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Apres introduction d’une constante 20 , la forme empirique de la SML 
est done de: 

R-it — Rft = cCj + (3j [R mt — R ft j + £j t 

Soit a definir: rj t = Rj t - Rft et r mt = R mt - Rft. On a done finalement: 
r it = a; + (3 ; [r mt ] + £; t 

Cette regression est done formulee en termes de rendements exce- 
dentaires, ou de primes de risque. Forts des enseignements delivres 
par les chapitres anterieurs, nous pouvons maintenant enoncer les 
conditions qui sont requises pour que 1’on puisse recourir a la methode 
des MCO pour estimer les parametres de cette equation: 

i) Les primes de risque doivent etre stationnaires. En effet, si 
elles ne l’etaient pas, on tomberait dans le piege des regres¬ 
sions fallacieuses 21 . 

ii) Les residus de cette regression doivent etre homoscedastiques 
et non autocorreles. S’ils ne l’etaient pas, l’estimateur des 
MCO ne serait pas efficient. De plus, ces residus doivent 
obeir a une distribution normale. Dans le cas contraire, les 
tests ne seraient valables qu’asymptotiquement, entre autres. 

De plus, en vertu du CAPM classique, la constante de la regres¬ 
sion ne doit pas etre significativement differente de 0, la relation entre 
les primes de risque doit etre lineaire et l’estime du beta ne doit pas 
varier dans le temps. 

Nous avons auparavant espose le test du CAPM tel qu’effectue 
par Berndt (1991). Selon Mills (1993) 22 , l’absence d’heteroscedasticite 
dans les estimations de Berndt, notamment sous sa forme condition¬ 
nelle, est plutot surprenante du fait des travaux anterieurs a ce sujet. 


20. Certes, la constante ne devra pas etre significativement differente de 0 pour que 
le CAPM soit valable. Cette constante est appelee alpha de Jensen. Elle mesure le 
rendement exceptionnel sur un titre, e’est-a-dire un rendement en sus de celui 
que justifie 1’ampleur du beta de ce titre. Un tel rendement exceptionnel n’a pas 
sa place sur des marches efficients. 

21. Cette allegation doit cependant etre nuancee si les primes de risque sont 
cointegrees, comme cela devrait etre. A ce sujet, voir le chapitre 9. 

22. Mills, T.C. (1993), The Econometric Modelling of Financial Time Series, Cambridge 
University Press, Cambridge. 
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De plus, d’autres etudes ont revele que le beta d’un titre est variable 
dans le temps. L’analyse du CAPM dans un contexte GARCH-M 
multivarie apparait done appropriee. C’est cette formulation que nous 
considerons maintenant. 


Analyse du CAPM dans le contexte GARCH-M multivarie 23 

Envisageons d’abord ce que 1’on entend par un modele de regression 
multivarie. Pour y arriver, on remplace la variable dependante y t du 
modele suivant: 


Yt =«0+£ a iyt-i + £Pi X t-i +U t 

i=l i=0 


par un vecteur: 

y t =[yit yat - y nt ] T 

On obtient alors le modele de regression multivarie 24 (dynamique) 
suivant: 


y t = C + ^A- r y t _; +^B- r x t _j +u t 

i=l i=0 

Dans cette expression, C est un vecteur (n X 1) de constantes; Ai, ..., 
A m sont des matrices (n X n) de coefficients retardes, Bo, Bi, ...,B m 
sont des matrices (k X n) de coefficients et u t est le vecteur (n X n) des 
residus. Sans entrer dans les details, disons que Pestimation d’un 
modele multivarie est une simple extension du cas univarie. 

Qu’entendre maintenant par un GARCH-M multivarie ? Dans 
sa forme simple, un modele GARCH-M peut s’exprimer de la fagon 
suivante: 


y t — X t P + 8h t + £ t 


23. Cette section s’inspire de Mills (1993), op. cit. 

24. Un tel modele est done multivarie (plusieurs variables) du point de vue des 
variables dependantes. Se pose alors le probleme de la modelisation des cova¬ 
riances entre les residus de ces variables. Le modele GARCH-M se presente 
comme une tentative de modeliser l’heteroscedasticite conditionnelle de ces 
residus. 
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h t =Yo+£Yie?-i+£<Mi t _i 

i=l i=l 

ou e t |‘J> t _ 1 ~N(0,h t ), F t _i etant l’ensemble d’informations disponi- 
bles jusqu’a t-1. Ce modele est une simple adaptation du modele 
ARCH-M. Dans le cadre d’un modele multivarie, modele qui a ete 
presente au debut de cette section, chaque element de la matrice 
variance-covariance conditionnelle peut s’exprimer comme suit, en 
supposant un processus GARCH(1, 1): 

hjjt = Cij +a ij e iit _ 1 e j!t _ 1 + b^hy^ 

ce qui complete la presentation du modele GARCH-M multivarie. 
Pour estimer ce modele, on suit la procedure habituelle en maximi- 
sant la fonction de vraisemblance en recourant a l’algorithme BHHH. 

Cette digression etant faite, nous pouvons maintenant nous pen- 
cher sur la mise en forme du CAPM selon la methode du GARCH-M 
multivarie qui permet, entre autres, de rendre le beta variable dans le 
temps. Cette formulation du CAPM est surtout due a Bollerslev, 
Engle et Woolridge (1988) 25 . Hall, Miles et Taylor (1989) ont egale- 
ment presente une version de ce modele 26 . 

De maniere a transposer le CAPM dans le cadre d’un modele 
GARCH-M, il faut d’abord l’exprimer sous une forme conditionnelle. 
L’esperance des rendements excedentaires devient done condition¬ 
nelle a l’ensemble des informations disponibles au temps t - 1, designe 
par F t _i. Sous forme conditionnelle, l’equation de la SML devient: 

E(Rp, |4v,) - R,.t -1 - (ip, [e(r„ |4>_, ) - R f , t ., ] 

et le beta: 

_ Cov(R pt ,R mt |<f> t _ 1 ) 

Pt vjR^I^) 


25. Bollerslev, T., R.F. Engle et J.M. Woolridge (1988), «A Capital Asset Pricing 
Model with Time-Varying Covariances », Journal of Political Economy, 96, p. 116- 
131. 

26. Hall, S.G., D.K. Miles et M.P. Taylor (1989), «Modelling Asset Prices with 
Time-Varying Betas», Manchester School, 57, p. 340-356. 
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Dans ce qui suit, de maniere a simplifier la notation, nous omettrons 
1’ensemble d’informations O t -i dans la notation des moments condi- 
tionnels : 1’indice t rattache a ces moments en tiendra lieu. La matrice 
variance-covariance conditionnelle des rendements est de: 


H t 


V.( R P.) 

Cov,(R pl ,R„) 


Cov,(R pt ,R„)' 

V,(R„) 


Comme l’on suppose que cette matrice peut maintenant varier dans le 
temps, il en resulte que les rendements esperes et les betas seront eux- 
memes variables dans le temps. 

Cette formulation du CAPM n’est pas encore operationnelle 
puisqu’il n’existe pas de series sur les rendements esperes. Pour pallier 
a ce probleme, Bollerslev, Engle et Woolridge ont suppose que le prix 
du risque est constant. Par rapport a la formulation presentee ante- 
rieurement, ce prix comporte la variance du rendement du porte- 
feuille du marche a son denominateur et non son ecart-type. Le prix 
du risque X. est done egal a: 


[E,(R m )-R,,-] 

V «( R n«) 


La prime de risque conditionnelle du portefeuille du marche peut 
alors etre exprimee en termes de sa variance conditionnelle: 

E t (R mt )-R fit _ 1 =W t (R rat ) 

Suite a cette hypothese, 1’equation de la SML conditionnelle 
devient: 


E,(R p ,) = R f .-+Cov,(R p „R„,) E ' ( ^“b^ J - 1 


= R f,t-l +CoV t( R pt. R mt)^ 

En definissant u pt comme : 

u P t =R P t _E t( R P t) 
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on obtient finalement: 


R P t = R f,t-i + ^ Cov t ( R pt - R mt ) + U pt 

De la meme fagon on peut ecrire: 

R mt = + A,V t (R mt ) + u mt 

Ces deux dernieres equations servent a estimer la version GARCH-M 
multivariee du CAPM. On constate que: 


V t (R mt ) = E t (u^ t ) = h mmt 

et que: 

Cov t (R pt ,R mt ) = E t (u pt ,u mt ) = h pmt 
Ce modele se formule comme suit: 

h ppt 


R pt 

- R f>t -r 




'o o r 




Upt 



= 


+ A, 



h mmt 

+ 


R m t 

- R f )t -i 


_«2. 


.0 1 °. 




u mt 


Lv* 

ou sous forme matricielle compacte: 

y t = a + dvech(Ht) + u t 


ou: 


y t =[ R pt - R f,t-l> R mt - R f,t-l] T 27 

vech(H t ) = [h ppt ,h mmt ,h pmt ] T 
u t =(u pt ,u mt ) 


0 


d = X 


0 


1 


0 1 0 


27. L’operateur matriciel vech vectorise le triangle inferieur de la matrice variance- 
covariance conditionnelle. 
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Bollerslev, Engle et Woolridge (1988) ont estime ce modele sur 
un echantillon americain comprenant des bons du Tresor a 6 mois, 
des obligations du Tresor a 20 ans et des rendements d’actions cotees 
a la NYSE. Leur echantillon consistait en des donnees trimestrielles 
s’etirant de 1959 a 1984, le taux sans risque choisi etant celui des bons 
du Tresor a 3 mois. L’estimation du prix du risque (A.) fut d’environ 
0,5. Les estimes des parametres de la variance conditionnelle furent 
tres significatifs pour les bons et les obligations. Pour les actions, ils 
ne l’etaient pas individuellement mais ils etaient hautement significa¬ 
tifs lorsque regroupes. Ces estimes sont utilises pour calculer les 
primes de risque: a + d vech(H t ) et les betas variables dans le temps 
implicites. Les bons et les obligations ont des primes de risque crois- 
santes apres octobre 1979, le beta des actions est rapproche de 1, le 
beta des obligations legerement superieur a 1 et celui des bons pres de 
0. Soulignons finalement que Hall, Miles et Taylor ont donne credit 
a la formulation du modele intertemporel du CAPM de Merton, qui 
donne la part belle a la fonction de consommation des agents econo- 
miques, cela dans le cadre du GARCH-M multivarie 28 . 


6. Une digression : la theorie de l'APT 29 

Nous ne saurions quitter ce chapitre sans faire etat d’un modele 
important en finance moderne: l’APT (Arbitrage Pricing Theory). En 
effet, celui-ci se veut plus general que le CAPM qui peut done etre vu 
comme un cas particulier de l’APT. La section qui suit nous permettra 
par consequent de mieux maitriser le CAPM. 


6.1. Le principe de I'arbitrage 

Le modele de l’APT repose sur une notion bien connue en finance 
moderne: I’arbitrage. Lorsque 1’equilibre des marches financiers est 


28. Voir a ce sujet: Merton, R.C. (1973), «An Intertemporal Capital Asset Pricing 
Model», Econometrica, 41, p. 867-887. 

29. Pour cette section, les references sont les suivantes: Copeland et Weston (1988), 
op. cit. ; Ingersoll, J.E. (1987), Theory of Financial Decision Making, Rowman et 
Littlefield, Maryland, 4 e edition, chap.7.; Elton, E.J. et M.J. Gruber (1995), 
Modem Portfolio Theory and Investment Analysis, New York, Wiley; Haugen, R.A. 
(1997), Modem Investment Theory, Prentice Hall, Englewoods Cliffs. 
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atteint, il ne doit subsister aucune possibility d’arbitrage. On dira qu’un 
arbitrage est possible quand un investisseur qui reamenage son porte- 
feuille sans injecter d’argent frais et qui n’assume aucun risque addi- 
tionnel peut obtenir un rendement positif additionnel. Autrement dit, il 
y a alors possibility d’un repas gratuit (free lunch). L’equilibre sur les 
marches financiers est caracterise par 1’absence de telles opportunites. 

Pour mieux comprendre le principe de 1’arbitrage, nous envisa- 
geons le cas de trois placements, dont les cash-flows respectifs appa- 
raissent au tableau 10.3. 


Tableau 10.3 


Cash-flows au temps 

to 

ti 

t2 

Placement 1 

-1 

0,049 

1,05 

Placement 2 

-1 

1,045 

0 

Placement 3 

-1 

0 

1,1025 


Trois placements sans risque s’offrent done. Tous les trois con¬ 
tent 1 $. Le premier placement genere un cash-flow de 0,049 $ au 
temps 1 et de 1,05 $ au temps 2. Le placement 2 donne pour sa part 
un cash-flow de 1,045 $ au temps 1 et aucun au temps 2. Finalement, 
le placement 3 fournit un cash-flow nul au temps 1 et un cash-flow de 
1,1025 $ au temps 2. 

Nous nous demandons s’il y a ici une possibility d’arbitrage. 
Autrement dit, en reamenageant son portefeuille compose de ces trois 
placements, un investisseur peut-il degager un profit net (free lunch) ? 
A cet effet, imaginons que notre investisseur effectue le reamenage- 
ment de portefeuille suivant. Il diminue le montant qu’il a investi dans 
le placement 1 de 10 000 $. Selon le tableau 10.3, il se prive alors d’un 
cash-flow de 490$ au temps to et de 10 500$ au temps ti. Pour 
reconstituer ces cash-flows, il investit d’abord un montant de: 


- = 468,90$ 
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dans le placement 1, ce qui lui permet de reconstituer le cash-flow de 
490 $ au temps ti qui a ete abandonne en sabrant dans le placement 1. 
Et pour reconstituer le cash-flow abandonne au temps t 2 , il investit le 
montant suivant dans le placement 2 : 

10500 

-= 9523,81 

1,1025 

La facture de ce reamenagement de portefeuille se monte a: 

468,90 + 9523,81 = 9992,71$ 

ce qui est inferieur au cash-flow libere lors du prelevement dans le 
placement 1, soit 10 000$. En reamenageant son portefeuille, l’indi- 
vidu a encaisse un profit net de 7,29 $. II a ainsi realise un arbitrage ! 

A hauteur de 1 $, le cout du placement 1 est done trop eleve. 
Pour calculer le prix juste de ce placement, nous devons actualiser ses 
cash-flows aux taux au comptant (taux spot) appropries. Chaque cash¬ 
flow doit etre actualise au taux au comptant dont la duree est egale a 
l’echeance de ce cash-flow. Or, les placements 2 et 3 sont assimilables 
a des obligations a coupon 0 30 dont les durees sont respectivement de 
un et de deux ans. Selon le tableau 10-3, le taux au comptant d’un an 
est de 4,5 % et le taux au comptant de deux ans, de: 

^1,1025-1 = 0,05 ou 5% 

Le prix d’equilibre du placement 1 est done de: 


0,049 1,05 

1,045 1,1025 


= 0,9993$ 


et non 1 $ comme l’indique le tableau 10.3. 

Une autre fagon de constater que le placement 1 est trop dispen- 
dieux est de calculer sa valeur future. Pour ce faire, il faut connaitre le 
taux de reinvestissement du premier cash-flow du placement 1 qui se 
produit au temps ti. Selon la theorie des taux a terme, le taux de 
reinvestissement, ou taux a terme d’un an dans un an, est ici egal a: 


30. Rappelons ici que les taux spots se calculent a partir des obligations a coupon 0. 
Pour plus de details a ce sujet, on consultera: Racicot, F.-E. et R. Theoret 
(2000), Traite de gestion de portefeuille, op. cit. 
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(1+R2) 2 

(i+ R .) 


1,045 


ou fi designe le taux a terme (tau x forward) d’un an dans un an; Ri, le 
taux spot de un an et R 2 , le taux spot de deux ans. La valeur future du 
placement 1 est de: 

0,049(1,055)+ 1,05 = 1,1017$ 

Or, le placement 3, qui est pourtant de meme cout que le placement 
1, comporte une valeur future de 1,1025 $. Le placement 1 est done 
surevalue en regard du placement 3. L’operation d’arbitrage consiste 
alors a vendre a decouvert {short) le placement 1 et a acheter le 
placement 3, jusqu’a ce que l’equilibre sur les marches financiers soit 
restaure. Celui-ci percera a jour quand le prix du placement 1 se sera 
abaisse a 0,9993 $ a la suite des ventes a decouvert dont il est victime, 
cela en vertu des calculs precedents. 

Abordons maintenant le phenomene de 1’arbitrage sur les mar¬ 
ches financiers dans une perspective beaucoup plus generate. Posons- 
nous la question suivante: comment peut-on calculer les prix 
d’equilibre des titres en recourant au principe de 1’arbitrage ? Quelle 
est la structure de prix qui doit prevaloir pour qu’il n’y ait plus de 
repas gratuit? Or, un theoreme bien connu en finance avance qu’il 
n’existera plus d’occasions d’arbitrage s’il existe un vecteur de prix p 
tel que: 

Bp = -a 

ou B designe la matrice des cash-flows des titres et a, le vecteur de 
leur cout (negatif). 

Forts de ce theoreme, recalculons le cout du placement 1 de sorte 
qu’il n’y ait plus trace d’arbitrage. Le systeme d’equations Bp = -a 
s’ecrit en faisant appel au tableau 10.3 : 


‘0,049 

1,05 ' 


'-ai" 



Pi 



1,045 

0 


= 

1 



_P2_ 



0 

1,1025 


1 
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ou ai designe le cout (negatif) du placement 1. Les equations corres- 
pondant a ce systeme matriciel sont: 

0,049p! +l,05p 2 = -aj 
l,045 Pl =1 
l,1025p 2 =1 


Selon les deux demieres equations, pi= 0,9569 et p 2 , 0,9070. En sub- 
stituant ces deux valeurs dans l’equation du placement 1, on trouve que 
ai = -0,9993 $, ce qui correspond bien au resultat trouve auparavant. 

Le systeme matriciel Bp = -a qui doit prevaloir lorsque 1’equilibre 
s’est instaure sur les marches financiers s’interprete done tres facile- 
ment. II signifie tout simplement que dans un univers sans risque, le 
prix d’un titre est la valeur actualisee de ses cash-flows, les facteurs 
d’actualisation etant calcules au moyen des taux spots correspondants. 
Le vecteur p est en effet un vecteur de facteurs d’actualisation, ou de 
prix des periodes. Dans notre exemple: 

p, = —*— = 0,9569 
1,045 

alors que p 2 est de: 


p 2 =-- = 0,9070 

(1.05) 


Les facteurs d’actualisation des periodes pi et p 2 sont done calcules a 
partir des taux spots correspondants. Le theoreme precedent indique 
qu’a 1’equilibre, la relation entre les cash-flows d’un titre et son prix 
est lineaire. 


Nous pouvons poser le probleme d’une autre fagon. Supposons 
que le cout du placement 1 soit de 1 $. Quelle valeur doit alors 
prendre le cash-flow du placement 2 pour qu’il y ait absence d’arbi- 
trage ? L’equation Bp = -a s’ecrit, dans ce cas: 


‘0,049 

1,05 ' 


T 



Pi 



C 2i 

0 


= 

l 



_P2_ 



0 

1,1025 


l 
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ou C21 designe le cash-flow recherche du placement 2. En solution- 
nant, on trouve que C21 = 1,0284$, ce qui implique que le taux spot 
d’un an doit etre de 2,84%. Le cout du placement 1 est alors de: 

0,049 1,05 

—-+ ——7 = 1 $ 

1,0284 (i,05) 2 

Pour que le prix d’equilibre du placement 1 soit de 1 $, il faut done 
que le taux spot d’un an soit de 2,84 % 31 si le taux spot de deux ans 
s’etablit a 5%. 

Nous sommes maintenant en mesure de formuler le theoreme de 
l’arbitrage de fagon plus rigoureuse en nous situant dans un univers 
sans risque. Soit le vecteur x suivant qui renferme les coefficients de 
reamenagement des n titres que comprend l’univers: 

x = (x 1 ,x 2 ,...,x n ) 

Un tel reamenagement constitue un arbitrage si deux conditions sont 
realisees: 

i) ce reamenagement doit generer des cash-flows au moins 
aussi eleves que le portefeuille initial: 

B T x > 0 

ou B est la matrice des cash-flows des titres. 

ii) Le reamenagement de portefeuille doit liberer des fonds 32 : 

a T x > 0 


31. Autrement dit, le premier cash-flow du placement 1 doit etre moins actualise de 
fagon a relever la valeur de ce placement. On peut egalement aborder ce pro- 
bleme en termes de valeur future. Etant donne que le taux spot de deux ans est 
alors beaucoup plus eleve que celui d’un an, on pourra reinvestir le premier cash¬ 
flow du placement 1 a un taux plus important que dans le tableau 10.3. Ce taux 
de reinvestissement est de 7,21 %, ce qui donne au placement 1 une valeur future 
identique a celle du placement 3. II n’y a done plus possibihte d’arbitrage. 

32. N’oublions que le vecteur a est constitue des couts des titres. Ses entrees sont 
done negatives. 
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Et en se basant sur des theoremes d’algebre lineaire etablis par 
H. Minkowski et J. Farkas, on peut enoncer les propositions suivantes : 

i) ou bien il existe un vecteur x tel que: 

a T x > 0 

et que: 

B t x > 0 

c’est-a-dire qu’il existe possibilite d’arbitrage; 

ii) ou bien, il existe un vecteur p de prix d’equilibre qui obeit au 
systeme lineaire suivant: 

Bp = -a 

et il n’y a plus possibilite d’arbitrage. 


Comme nous serons a meme de le constater ulterieurement, 
cette condition s’avere tres importante dans la formulation de l’equa- 
tion de base de 1’APT: Arbitrage Pricing Theory. 


6.2. L'APT: aperqu general 

L’APT peut etre presentee comme une theorie concurrente au CAPM, 
qui vise comme elle a determiner les rendements d’equilibre des 
titres. Mais contrairement au CAPM, l’APT ne se situe pas dans le 
cadre de 1’analyse moyenne-variance mis de 1’avant par Markowitz au 
debut des annees 1950. Elle ne suppose done pas que la distribution 
des rendements est normale. Elle ne donne pas non plus un role 
particulier au portefeuille du marche comme e’est le cas pour le 
CAPM ou le portefeuille du marche, piece maitresse de la CML, doit 
etre efficient. L’APT se veut beaucoup plus generale que le CAPM. 
Elle repose sur le principe de l’arbitrage tel qu’il vient d’etre enonce. 
Lorsque l’equilibre des marches financiers est atteint, il doit en effet 
y avoir absence d’arbitrage. Le modele de l’APT essaie de degager 
1’incidence de cet imperatif sur les rendements d’equilibre des titres. 
Cependant, comme nous le verrons, en se voulant plus general que 
CAPM, il en arrive egalement a des conclusions moins specifiques. 
C’est pourquoi ce modele n’a pas reussi a detroner le CAPM, qui jouit 
encore d’une grande popularity apres plus de quarante ans d’existence. 
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6.3. Derivation du modele de I'APT 

La notion de matrice orthogonale 

La derivation de I’APT fait appel a la notion de matrice orthogonale. 
Rappelons-la. La matrice carree A est orthogonale si 

A T A = AA T =1 

Si la matrice A est orthogonale, on peut done ecrire: 

A -1 = A t 

Cette egalite matricielle implique que les vecteurs qui ferment 
les lignes (ou les colonnes) d’une matrice orthogonale constituent un 
ensemble orthonormal. Designons la i e ligne (ou colonne) de A par a,. 
Un ensemble orthonormal se definit comme suit: 

aj a i = 1 si i = j 
a^aj = 0 si i * j 

Dans une matrice orthogonale, chaque vecteur est done norma¬ 
lise pour avoir une longueur unitaire et est orthogonal a tout autre 
vecteur. 


Les equations de I'APT 

Le modele de I’APT hit propose par Ross 33 en 1976. On se souvient 
que dans le modele classique du CAPM, l’esperance du taux de rende- 
ment d’un titre ne depend que d’une seule variable: la prime de risque 
du portefeuille du marche, soit [E(Rm) - Rf], Le modele de I’APT se 
veut beaucoup plus general. A l’interieur de celui-ci, le rendement du 
titre i est une fonction lineaire de k facteurs. L’equation du rendement 
du titre i (R;) est la suivante: 

R i = E(R;) + b il F 1 +... + bii-F,, + E; 


33. Ross, S.A. (1976), «The Arbitrage Theory of Capital Asset Pricings Journal of 
Economic Theory, decembre, p. 343-362. 
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ou Fj sont les divers facteurs et by, les betas respectifs de ces facteurs. 
l’innovation, represente le risque non systematique du titre i. 

Les previsions du marche sont emmagasinees dans E(Ri). Les 
facteurs represented des variables non anticipees pertinentes pour 
predire R;. Par exemple, l’inflation non anticipee peut etre l’un de ces 
facteurs ou encore la croissance non anticipee du Pib. 

Reste a determiner l’equation de E(Ri). Pour y arriver, il faut se 
rappeler que l’APT repose sur le principe de l’arbitrage. Ce principe 
s’enonce comme suit. A l’equilibre, les reamenagements de porte- 
feuilles qui ne requierent aucune injection d’argent ffais et qui, de 
plus, ne comportent aucun risque doivent degager un rendement nul. 
Nous nous attaquons maintenant a la construction de portefeuilles 
d’arbitrage 34 en mettant en application ce principe. 

i) Un portefeuille d’arbitrage ne doit comporter aucune injec¬ 
tion d’argent ffais. Soit x le vecteur des coefficients de rea- 
menagement d’un portefeuille compose de n titres. Cette 
condition s’ecrit comme suit: 

£>i= 0 

i=l 

Transposons-la en termes matriciels : 

V 

1 

[ x i x 2 - X n ] =0 


1 

soit: 


34. Attention ! Un portefeuille d’arbittage designe ici un portefeuille pour lequel il 
y a absence d’arbitrage. 
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ce qui signifie que le vecteur x doit etre orthogonal au vec- 
teur unitaire 1 a l’equilibre. 

ii) Un portefeuille d’arbitrage doit etre sans risque. 

Les Xj doivent etre choisis de fagon telle que pour tout facteur 
(ici k), la somme des bit soit nulle. 

X/i b ik =° 

Les bit sont les betas du facteur k pour chaque titre i. Cette equation 
signifie que la somme de ces betas pour le facteur k, ponderes par les 
facteurs de reamenagement de portefeuille, doit etre nulle a 1’equilibre. 
Autrement dit, le reamenagement n’accroit pas le risque relie au 
facteur k a travers l’ensemble du portefeuille. 

Le vecteur des betas des n titres associe au facteur k s’ecrit 
comme suit: 


V 

b 2k 


LbnkJ 

La deuxieme condition de 1’absence d’arbitrage est done la suivante: 



[xi x 2 ... x n ] =0 

_ b nk _ 
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soit, pour l’ensemble des facteurs: 

x t B = 0 

ou en supposant k facteurs, B est egal a: 

bn b 12 b lk 

b 2 i b 22 b 2k 


_b n i b n2 b nk _ 

A l’equilibre, le vecteur x doit done etre egalement orthogonal a la 
matrice B qui renferme les betas des n titres pour les k facteurs. 

iii) Le taux de rendement d’un portefeuille d’arbitrage doit etre 
nul. 

Cette condition s’ecrit: 

R p =£x I E(R 1 ) = 0 
soit, en termes matriciels : 

R = x T E(R) = 0 

A l’equilibre, le vecteur x doit finalement etre orthogonal au vecteur 

E(R). 

Les trois equations que nous venons d’ecrire caracterisent les 
portefeuilles d’arbitrage. Elies sont: 

x T l = 0 
x t B = 0 
x t E(R) = 0 
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Le vecteur x est done orthogonal a trois vecteurs ou matrice a 
l’equilibre: le vecteur unitaire, la matrice B et le vecteur E(R). La 
consequence algebrique est que le rendement espere du titre i est une 
combinaison lineaire du vecteur vecteur unitaire et du vecteur de ses 
betas factoriels, e’est-a dire: 


E(R 1 ) = ^ 0 + A-ibj! + ... + X]jbj]j 

C’est la le resultat principal de la theorie de l’APT. 

Pour mieux comprendre ce resultat algebrique, situons-nous dans 
un monde de trois titres. Supposons egalement qu’un seul facteur 
explique le rendement de ces trois titres. Les trois conditions de 
l’absence d’arbitrage ou de l’equilibre s’ecrivent alors, en termes 
matriciels: 


1 1 1 

x i 


0 

bi b 2 b 3 

x 2 

= 

0 

E(Ri) E(R 2 ) E(R 3 ) 

x 3 


0 


Nous sommes ici en presence d’un systeme d’equations hneaires homo¬ 
genes 35 du type Ax = 0. Pour que ce systeme admette une solution non 
triviale, il faut que la matrice A soit singuliere, ce qui revient a dire 
dans notre exemple que son rang doit etre inferieur a 3. La conse¬ 
quence algebrique est que la troisieme ligne de cette matrice est une 


35. La solution d’un tel systeme d’equations est reliee au rang de la matrice A. Une 
matrice est d’ordre r si et seulement si l’un de ses determinants d’ordre r n’est pas 
nul et que tout determinant d’ordre superieur a r est nul. Supposons que A soit 
une matrice carree de dimension (n X n). Si le rang de cette matrice est de n, 
e’est-a-dire que cette matrice admet un inverse, alors le systeme d’equations 
homogenes admet une seule solution dite triviale: le vecteur x est alors egal au 
vecteur nul. Si le rang de la matrice A s’avere inferieur a n, le nombre d’inconnues 
est alors superieur au nombre d’equations et le systeme admet alors plusieurs 
solutions non triviales. Dans le cas special ou le rang de A est egal a (n- 1), la 
solution est unique a un vecteur de proportionnalite pres. L’espace vectoriel qui 
renferme l’ensemble des solutions d’un systeme d’equations homogenes est appele: 
le kernel de A. Pour plus de details sur la solution d’un systeme d’equations 
lineaires homogenes, on consultera par exemple: Judge, G.G. et al. (1988), 
Introduction to the Theory and Practice of Econometrics. 2 e edition, John Wiley and 
Sons, New York. 
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combinaison lineaire des deux premieres, celles-ci ne pouvant en effet 
etre colineaires. II en resulte que: 


'E(R O' 


T 


'V 

E(R 2 ) 

= 

1 

x 0 + 

b 2 

E(R 3 ) 


l 


>3. 


A l’equilibre, l’esperance du rendement d’un titre est done une 
fonction lineaire de son beta respectif. Si Ton retient la prime de 
risque du marche pour expliquer 1’esperance du rendement d’un titre, 
on renoue alors avec le CAPM: Xp est alors le taux sans risque et Xi, 
la prime de risque du marche. C’est dans ce sens que le CAPM est un 
cas particular de l’APT lorsqu’il n’existe qu’un seul facteur explicatif 
du rendement d’un titre: celui du portefeuille du marche. 

S’il existe k facteurs explicatifs, la meme methodologie s’applique 
pour trouver l’esperance du rendement du titre i. 

E(Ri)=A 0 +Xib n + ... + ?i k b ik 

Le coefficient \o est assimilable au taux sans risque. En effet, si 
le titre i ne comporte aucun risque, tous ses bjj sont nuls. L’esperance 
du rendement du titre i se reduit alors a : 

E(R 1 ) = X 0 

ce qui ne peut etre que le taux sans risque. 

Les autres \j de l’equation peuvent etre interpretes en termes de 
rendement excedentaire, c’est-a-dire en termes de rendement requis 
au-dela du taux sans risque pour supporter une unite du risque associe 
au facteur j. Par exemple, Xi est le rendement excedentaire requis 
pour supporter une unite supplementaire du risque associe au facteur 
1. II peut done etre assimile au prix du risque 36 du facteur 1. On peut 
designer ce rendement excedentaire par l’expression suivante: 

= 5j -R f 


36. On insiste ici sur la correspondance entre rendement excedentaire par unite de 
risque et prix du risque, cela pour chaque categorie de risque. 
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ou 8j est le rendement d’un portefeuille qui comprend une unite du 
risque associe au facteur 1 et une quantite nulle de tout autre facteur. 
Et ainsi de suite pour les autres X;. 

L’equation de l’esperance du rendement du tdtre i peut done etre 
reecrite comme suit: 

E(R,)-R f =(5 1 -R f )b„+(5 2 -R f )b, 2 +...+(8 l -R f )b il 

En resume, le modele de l’APT renferme deux categories d’equa- 
tions 37 : 

i) L’equation du rendement du titre i: 

R-i = E(R;) + bjjFj +... + bj k F k + £; 

ii) L’equation de l’esperance du rendement du titre i: 
E(R,)-R, =(5 1 -R t )b, 1 +(8 2 -R f )b, 2 +... + (8 t -R f )b il 

II est a noter que cette derniere equation peut etre interpretee 
comme une regression lineaire si l’on formule les hypotheses 
suivantes :1) la distribution des rendements est normale; 2) les facteurs 
ont ete transformes lineairement de telle sorte que les vecteurs trans¬ 
formes soient orthonormaux. Les bit sont alors egaux a: 

u _ COV(Ri,8 k ) 

b ik —- 

VAR(8 k ) 

ou 8 k est la transformation lineaire du k e facteur. 

Remarquons finalement que le modele de l’APT est plus robuste 
que le CAPM: 1) il n’emet pas d’hypotheses quant a la distribution 
des rendements des titres. Le CAPM suppose pour sa part que cette 
distribution est normale; 2) l’APT ne formule pas d’hypotheses fortes 
quant aux fonctions d’utilite des individus 38 ; 3) les taux de rendement 


37. Les equations correspondantes pour le CAPM sont les suivantes. L’equation du 
rendement du titre i s’ecrit, dans ce modele: Rj - R f = P ; (R m - R f ) + e ; . Alors 
que l’equation de l’esperance du rendement du titre i est de: 

E(R i ) = R f+ p i [E(R m )-R f ]. 

38. En effet, pour que le CAPM soit valable en l’absence de 1’hypothese de la 
distribution normale des rendements, il faut que la fonction d’utilite d’un indi- 
vidu soit quadratique de fagon a recuperer l’analyse moyenne-variance. 
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d’equilibre peuvent dependre de plusieurs facteurs dans l’APT, et non 
d’un seul comme c’est le cas dans le cadre du CAPM classique; 
4) 1’APT n’accorde aucun role particular au portefeuille du marche 
alors qu’il tient le haut du pave dans le modele du CAPM. De plus, le 
portefeuille du marche doit etre efficient dans le modele du CAPM, 
sinon ce dernier modele n’est pas valable. 

En se voulant plus general, le modele de 1’APT aboutit toutefois 
a des conclusions moins specifiques que le CAPM. L’APT reste en 
effet muet sur Pidentite des facteurs. C’est la son talon d’Achille. Le 
CAPM identifie pour sa part un unique facteur pour expliquer le 
rendement d’un titre: la prime de risque du marche. C’est pourquoi le 
CAPM jouit encore d’une grande popularity meme si l’APT voulait 
au depart dominer le CAPM. 


6.4. Tests de I'APT 

La procedure habituelle pour tester le modele de l’APT est la sui- 
vante: 1) colliger des series statistiques sur les rendements d’un groupe 
d’actions; 2) recourir a l’analyse factorielle pour determiner simulta- 
nement le nombre de facteurs et leurs betas pour chaque titre, c’est- 
a-dire estimer les parametres et determiner les facteurs de la premiere 
equation de 1’APT: 

Rj = E(R ; ) + b ;i Lj +... + b jk L k + e ; 

3) utiliser les betas ainsi calcules pour determiner les primes de risque 
ou les X. de chacun des facteurs. On recourt a la regression pour 
estimer ces primes de risque (rendements excedentaires) ou prix des 
diverses categories de risque. C’est-a-dire que l’on estime les \j dans 
la seconde equation de l’APT: 

E(R 1 ) = ^ 0 + Xjbjj + ... + X. k bj k 

C’est la une regression en coupe instantanee ou les E(Ri) sont 
approximes par une moyenne de rendements calculee sur la periode 
de temps choisie et ou les bq proviennent de la premiere etape du test. 
On regresse done les rendements moyens sur les betas pour obtenir 
les lambdas. 
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Comme cela fut mentionne auparavant, le modele de l’APT ne 
specifie pas la nature des facteurs: cela releve des tests empiriques. 
Les premieres verifications de l’APT ont demontre que le marche ne 
remunerait qu’un nombre limite de facteurs, trois ou quatre, sans 
plus. L’APT ne specifie pas la nature des facteurs. Le test empirique 
de l’APT qui a retenu le plus d’attention est celui effectue par Chen, 
Roll et Ross 39 en 1983. Leur etude permet d’identifier quatre variables 
macroeconomiques comme candidates au titre de facteurs: 1) la pro¬ 
duction industrielle; 2) le changement dans une prime de risque de 
defaut, mesuree par la difference 40 entre les rendements des obliga¬ 
tions de cote AAA et celles de cote Baa; 3) la difference 41 entre les 
rendements a l’echeance des obligations gouvemementales a long et a 
court termes; 4) l’inflation non anticipee. A premiere vue, le choix de 
telles variables surprend, c’est le moins qu’on puisse dire. Mais il se 
justifie par le concept meme du prix d’un titre, qui peut etre defini 
comme la valeur escomptee de ses cash-flows anticipes. La production 
industrielle est reliee aux cash-flows. Les autres variables retenues par 
Chen, Roll et Ross ont trait au taux d’escompte utilise pour escompter 
les cash-flows dudit titre. Une telle analyse se revele utile sur le plan 
empirique. Comme les facteurs sont orthogonaux 42 , du moins l’ana- 
lyse factorielle les a reduits a cette condition, il est en principe possible 
de choisir un portefeuille qui est protege contre l’inflation sans que 
son exposition aux autres facteurs ne soit modifiee. On peut done 
couvrir {hedge) les facteurs ! 


39. Chen, N.F. et al. (1983), « Economic Forces and the Stock Market: Testing the 
APT and Alternative Asset Pricing Theories», document de travail, UCLA, 
decembre. 

40. Cet ecart representant le risque de credit d’une entreprise. 

41. Cet ecart tenant lieu de la structure a terme des taux d’interet. 

42. C’est-a-dire qu’il y a absence de correlation entre les facteurs. 
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CHAPITRE 


11 

LA METHODE DES MOMENTS 
GENERALISES 


Ce chapitre presente une classe d’estimateurs aux proprietes asympto- 
tiques regroupes sous le vocable: methodes des moments generalises, 
que nous designerons par 1’acronyme anglais GMM (Generalized 
Method of Moments). Cette methode presente plusieurs avantages: i) la 
methode du GMM fait la synthese de plusieurs estimateurs bien con- 
mis, comme l’estimateur des MCO, l’estimateur des variables instru- 
mentales, l’estimateur des doubles moindres carres et l’estimateur des 
doubles moindres carres non lineaires. De plus, il nous fournit un 
cadre d’analyse general pour la comparaison de ces divers estimateurs 
et leur evaluation; ii) 1’estimateur du GMM nous procure une solu¬ 
tion de rechange simple a d’autres estimateurs, specialement dans les 
cas ou il est ardu d’ecrire la fonction de vraisemblance dans le but de 
calculer 1’estimateur du maximum de vraisemblance. 

Il faut toutefois souligner que l’estimateur du GMM vaut pour 
les grands echantillons. C’est-a-dire que les proprietes desirables de 
cet estimateur ne seront obtenues que dans les grands echantillons. 
Ainsi, 1’estimateur du GMM est asymptotiquement efficient mais il 
n’est que rarement efficace. 


1. Introduction A la methode des moments 

Selon Hamilton (1994) 1 , une description generale de la methode clas- 
sique des moments peut s’enoncer comme suit: soit un vecteur (a X 1) 


1. Hamilton, J.D. (1994), Time Series Analysis, Princeton University Press, Princeton. 
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de parametres inconnus 0 qui caracterise la fonction de densite d’une 
variable observee y t . Supposons que l’on puisse exprimer les a mo¬ 
ments de la population comme des fonction de q, telles que: 

E (yl) = Ri (9) pour i = ij,i 2 * -,h ■ 

La methode classique des moments estime 0 comme la valeur 0 T pour 
laquelle ces moments de la population sont egaux aux moments 
echantillonnaux observes. C’est-a-dire que 0 T est la valeur pour la¬ 
quelle les equations suivantes sont realisees: 



Illustrons la methode des moments a partir d’un exemple simple, 
tire de Judge et al. (1988). 2 Soit Yi, Yt, un echantillon aleatoire 
d’une population N(0, a 2 ). On sait que : 

E[Y] = 0-p 2 

et que: 

o 2 =e[y 2 ]-(e[Y]) 2 =H2-h; 

ou p,i designe le i e moment par rapport a l’origine. En egalant les 
moments de la population aux moments echantillonnaux, ce qui est le 
principe meme de la methode des moments, on obtient: 

£y, 

Ai = —— = y = 0 

T 

et 

EY 

p 2 =— -= a 2 +0 2 


2. Judge, G.G., R.C. Hill, W.E. Griffiths, H. Liitkepohl et T.-C. Lee (1988), 
Introduction to the Theory and Practice of Econometrics, 2 e edition, John Wiley and 
Sons, New York, p. 61-62. 
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Par consequent, 





La methode des moments nous a done permis d’estimer les deux 
premiers moments de notre population 3 . 

Le cas precedent est le plus simple, designe en anglais par location 
model. Mais il se peut que, pour estimer un parametre, il faille recourir 
a plusieurs moments. Il faut alors ponderer ces moments d’une fagon 
ou d’une autre pour estimer lesdits parametres. Soit g le vecteur des 
moments. Pour estimer les parametres d’un modele, il faudra alors 
minimiser une fonction critere representee par la forme quadratique 
suivante (Q): 


Q = g T Wg 

ou W est la matrice de ponderation de ces moments. Tout repose 
alors sur la selection de la matrice W. Hamilton (1994) relate l’histo- 
rique de l’evolution de cette matrice qui devait aboutir a la methode 
du GMM. Un estimateur base sur la minimisation d’une expression de 
type Q fut appele minimum chi-square par Cramer en 1946. Ferguson 
en 1958 et Rothenberg en 1973 ont retenu la meme appellation alors 
que M a. 1inva.nd en 1970 le nommera: estimateur de distance minimale. 
Mais il faudra attendre Hansen en 1982 pour avoir la forme la plus 
sophistiquee et la plus rigoureuse de cette approche, soit la methode 
des moments generalises, dont l’acronyme est le GMM 4 . Selon 


3. A remarquer cependant que l’estimateur de la variance est biaise. L’estimateur 

t(Y,-Y) 2 

non biaise est de : 6 2 = —-. 

T-1 

4. L’article de base en ce qui concerne Papproche du GMM est: Hansen, L. (1982), 
«Large Sample Properties of Generalized Method of Moments Estimator», 
Econometrica, 50, p. 1029-1054. Pour une presentation simplifiee, voir: Hall, A. 
(1992), « Some Aspects of Generalized Method of Moments Estimation », docu¬ 
ment de travail, North Carolina State University; Ogaki, M. (1992), «General¬ 
ized Method of Moments: Econometric Applications », document de travail, 
University of Rochester. 
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Davidson et McKinnon (1993) 5 , l’idee essentielle qui sous-tend la 
methode du GMM est que des conditions de moments peuvent etre 
utilisees non seulement pour specifier un modele mais egalement 
pour definir les parametres de celui-ci. La meilleure fagon de com- 
prendre cette methode est de la positionner par rapport aux methodes 
d’estimation classiques, sujets qui font l’objet des prochaines sections. 


2. La methode des moments et les MCO 

La methode du GMM tire son interet du fait que plusieurs problemes 
d’estimation sont une simple fonction des moments. Pour fixer les 
idees, considerons le modele de regression lineaire suivant: 

y = X(3 + e 

ou y est un vecteur de dimension (n X 1), X est une matrice de 
dimension (n X k), p est le vecteur des parametres a estimer de 
dimension (k X 1) et e, le vecteur des residus, de dimension (n X 1). 
e ~ Q(0, ct 2 ), Q etant une distribution quelconque. Supposons egale¬ 
ment que X soit orthogonale a e, c’est-a-dire: 

E(x T e) = 0 

Nous voulons ici estimer le vecteur (3. Nous savons qu’au niveau de la 
population: 

E[x T (y-X|i)] = 0 

puisque e = y - Xp. La methode transpose cette derniere equation au 
niveau echantillonnal. Pour ce faire, on remplace l’operateur E par 
son equivalent echantillonnal, soit la moyenne. On a done: 

ix T (y-Xfj) = 0 

Comme nous savons que b realise Porthogonalite entre la matrice 
d’observations X et le vecteur des residus e, il est done loisible de 


5. Davidson, R. et J.G. Mackinnon (1993), Estimation and Inference in Econometrics. 
Oxford University Press, New York. 
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transposer ce resultat au niveau echantillonnal. p, soit l’estimateur de 
P, devra done realiser 1’egalite suivante: 

~X T (y - Xp) = 0 

On peut done solutionner cette equation de moments pour P : 

p„o»=( xTx )"‘ xT y 

soit l’estimateur des MCO ! On retrouve done l’estimateur des MCO 
non pas en mimimisant la somme des residus mais bien en recourant 
a l’equation implicite des moments. 


3. La methode des moments et l'estimateur 

DES VARIABLES INSTRUMENTALES 

Supposons que: 

E(x T e)*0 

Nous devons alors recourir a des variables instrumentales pour renouer 
avec les conditions d’orthogonalite entre ces variables et les residus: 

E(x T e) = 0 

On transpose facilement la section precedente au probleme qui nous 
interesse, soit determiner un estimateur convergent de p. L’ortho- 
gonalite entre les variables instrumentales et les residus au niveau 
echantillonnal s’ecrit done comme suit: 

-Z T (y-xp) = 0 

La solution: 


P = (z T x)~'z T y 
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n’est envisageable que lorsqu’il est possible d’inverser la matrice Z T X. 
Cette condition est valable si le systeme d’equations est exactement 
identifie, c’est-a-dire que les variables instrumentales permettent 
d’identifier exactement le vecteur p des parametres. L’estimateur qui 
resulte de la condition des moments est appele estimateur des moindres 
carves indirects. 

Dans la pratique, le nombre d’instruments excede habituelle- 
ment le nombre de parametres a estimer. On est alors confironte a un 
systeme suridentifie et la matrice Z T X, qui n’est plus alors une matrice 
carree, ne peut done plus etre inversee. On pourrait a la limite se 
delester d’instruments de telle sorte que le systeme d’equations soit 
exactement identifie, mais on ferait alors abstraction d’informations 
pertinentes pour l’estimation. 

Par simple analogic avec les MCO, on pourrait estimer le vec¬ 
teur p en minimisant la forme quadratique suivante, qui represente, 
grosso modo, la somme des residus au carre: 



On remarquera que l’on pondere ici les moments d’egale fagon. 
L’estimateur qui en resulte s’avere convergent, mais comme le sys¬ 
teme de ponderation des moments n’est pas optimal, l’estimateur 
obtenu ne fait pas figure de meilleur de sa classe. Hansen (1982) 6 a 
derive l’estimateur optimal dans sa classe pour le probleme precedent. 
II suffit de minimiser le systeme suivant. L’estimateur qui en resulte 
est appele GMM: 



6. Hansen, L. (1982), « Large Sample Properties of Generalized Method of Mo¬ 
ments Estimator», Econometrica, 50, p. 1029-1054. Pour une presentation sim- 
plifiee, voir: Hall, A. (1992),« Some Aspects of Generalized Method of Moments 
Estimation », document de travail, North Carolina State University; Ogaki, M. 
(1992), « Generalized Method of Moments: Econometric Applications », docu¬ 
ment de travail, University of Rochester. Ce chapitre est base sur le cahier de 
recherche suivant: Racicot, F-E. et R. Theoret (2001), «La methode econome- 
trique du GMM et 1’estimation des parametres de modeles financiers stochas- 
tiques. Analyse d’un cas: le modele de taux d’interet de Schaefer et Schwartz », 
document de travail du CRG, Ecole des sciences de la gestion. 
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ou V 1 est un estimateur convergent de |v|^— (z T e)jj . Selon 

cette formulation, une restriction estimee de fagon moins precise 7 se 
verra attribuer une ponderation plus faible, par l’intermediaire de la 
matrice V -1 , qu’une restriction qui est estimee avec plus de precision 8 . 

Dans le cas ou les erreurs sont homoscedastiques et independantes, 
1’estimateur qui decoule de la minimisation du critere associe au GMM 
se confond avec 1’estimateur des doubles moindres carres (2SLS): 



(x T z)v-'(z T y-Z T Xp) = 0 


De cette equation, il resulte que (3 est egal a: 

p = (x T zv- 1 z T x)" 1 (x T z)v- 1 z T y 

II reste a specifier la valeur de V -1 . Sous les hypotheses actuelles 
d’homoscedasticite et du caractere IID de l’innovation, la methode 

des moments suggere que: V -1 = / n 2 jz T Z j . La forme finale 

de P est de: 

p = (x T z(z T zf‘ Z T X J‘ (x T z(z T zf ‘ Z T y) 

Ce qui est bien 1’estimateur des doubles moindres carres. 

Ouvrons ici une parenthese les doubles moindres carres non 
lineaires. Comme cela fut mentionne auparavant, y a alors la forme: 

y - f(X,P) + £ 


7. C’est-a-dire qui comporte une variance plus elevee. 

8. C’est-a-dire qui comporte une variance plus faible. 
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Pour obtenir les doubles moindres carres non lineaires selon la methode 
des GMM, il suffit de remplacer dans la fonction precedente Min(.) 
l’expression |z T |y-Xpj| par |^Z T |y- f|x,p)jJ. 

4. GMM ET CONDITIONS D'ORTHOGONALITE 

De fagon generale, la metiiode du GMM est basee sur des conditions 
d’orthogonalite de la population: 

E[g(y,X,e„)] = 0 

ou g(.) est une fonction continue de (y, X) et de parametres qui sont 
uniques et qui font que l’esperance egale zero. 

Precisons les proprietes de l’estimateur des GMM en les reliant 
aux conditions d’orthogonalite. L’estimateur des GMM resulte du 
probleme de minimisation suivant: 

Min^m(y,X,e) T W n m(y,X,9 
ou m(y,X,0) = l/nJ^g(y i ,X i ,0) et ou W n peut etre estimee par la 

i=l 

matrice de White (1980), dite encore HCCM, ceci pour avoir le 
meilleur estimateur convergent de cette matrice. On trouve 0 en 
solutionnant la condition suivante de premier ordre: 

^?^W n m(.) = 0 

ae T w 


ou l’on symbolise la matrice des derivees premieres par G =-. 

30 

La distribution de 0 resulte d’une approximation de Taylor de 
g(0) autour de 0 q. Dans son article, Hansen (1982) a demontre que: 


0~n|0 o ,(g t wg) -1 g t whwg(g t wg) 
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ou Cl = E^g(y,X,0 o )g(y,X,0 0 ) T ] qui est tout simplement la variance 

de la condition des moments. Hansen (1982) a demontre qu’un 
choix optimal de W est simplement un estime heteroscedastique et 
convergent de: 


E[g(y.x,e„)g(y,x,e 0 ) T ]'‘=n - 1 

Si l’on dispose d’un estime convergent de 0, alors un estime de fl 1 
peut etre obtenu. La distribution asymptotique de 0 se reduit alors a: 

0~n[\,(g t ii- 1 g)" 1 j 

Quelle que soit la matrice de ponderation W, l’estimateur du GMM 
est toujours convergent et non biaise asymptotiquement et lorsque 
l’on recourt au W optimal, l’estimateur du GMM est alors 
asymptotiquement efficient dans la classe des estimateurs definis par 
les conditions d’orthogonalite. Finalement, la matrice de White (1980), 
dite encore HCCM, semble etre le meilleur candidat pour cette 
matrice de ponderation. 


5. Maximum de vraisemblance et GMM 


La methode du maximum de vraisemblance s’integre facilement dans 
l’univers du GMM. Pour estimer les parametres selon cette methode, 
il suffit de realiser la condition suivante: 


31nL(0,X) 

30 

c’est-a-dire qu’au maximum de vraisemblance, le score est nul. Dans 
le langage du GMM, cette condition s’ecrit comme suit: 


m(y,X,0) = 


31nL 

30 


= 0 


ce qui est simplement une condition de moments. 
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Precisons d’avantage. Dans le cas le plus simple, la methode du 
GMM est: 

Min^m(y,X,0) T H _1 m(y,X,0)) 

ou H est la matrice des poids, soit la variance des conditions des 
moments. En termes de la methode du maximum de vraisemblance, 
cette matrice s’ecrit: 



soit la matrice d’information. L’operation Min s’ecrit dans ce cas: 

3 2 InL H _ t 31nL _ Q 
3030 T 30 

soit l’equation qui definit l’estimateur du maximum de vraisemblance. 
Par consequent, l’estimateur du maximum de vraisemblance peut etre 
vu comme un estimateur GMM. 

Certains chercheurs preferent recourir au GMM plutot qu’a la 
methode du maximum de vraisemblance. Voici leurs motifs: 1) 1’esti- 
mateur du maximum de vraisemblance est parfois difficile a calculer. 
II existe alors un GMM qui est asymptotiquement moins efficace que 
l’estimateur du maximum de vraisemblance, mais qui est toutefois 
convergent et plus facile a calculer; 2) quelquefois, l’on ne dispose pas 
assez d’information sur la distribution empirique des donnees pour 
specifier completement la fonction de vraisemblance. Par contre, on 
dispose habituellement d’une quantite suffisante d’information pour 
specifier les conditions des moments et recourir ainsi a l’estimateur 
GMM. 

L’estimateur du GMM s’integre done dans la classe des estima- 
teurs semi-parametriques. 
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6. Applications 

Dans cette section, nous visons a montrer comment les parametres 
d’une equation differentielle stochastique peuvent etre estimes en 
recourant a la methode du GMM. En effet, devaluation de ces para¬ 
metres s’avere de toute premiere importance pour estimer les prix des 
options. Les parametres que nous voulons estimer dans cette section 
sont ceux du modele stochastique bifactoriel de taux d’interet de 
Schaefer et Schwartz (1984) 9 . Mais avant de presenter ce modele, 
nous rappelons les formes generates des mouvements browniens en 
temps continu, puis en temps discret. Nous verrons alors comment la 
discretisation d’une equation differentielle stochastique peut aboutir a 
un processus autoregressif. Nous serons alors a meme de nous atta- 
quer a l’estimation des parametres du modele de Schaefer et Schwartz 
par la methode du GMM. 

Le recours a la methode du GMM marque une avancee impor- 
tante pour l’estimation des parametres d’une equation differentielle 
stochastique dans le domaine de la finance empirique, notamment 
dans le champ de la theorie des options et de la finance corporative. 
En effet, bien souvent par le passe, on estimait ces parametres en les 
egalisant directement a leur moment empirique correspondant. Ainsi, 
on estimait le drift d’un processus stochastique par la moyenne de la 
variable analysee et sa volatility par son ecart-type historique. Cette 
procedure n’apparait pas des plus satisfaisantes, il s’en faut de beau- 
coup, quand on sait que la methode du GMM permet d’estimer ces 
parametres de fagon robuste. 

La theorie des options est basee sur la resolution analytique ou 
numerique d’equations differentielles stochastiques 10 . L’une des 
formes les plus simples de cette categorie d’equations est mouvement 
brownien avec drift. L’equation differentielle de ce mouvement est la 
suivante: 


dx = a(x,t)dt + b(x,t)dz 


9. Schaefer, S.M. et Schwartz, E.S. (1984), «A Two Factor Model of the Term 
Structure : An Approximate Analytical Solution », Journal of Financial and Quan¬ 
titative Analysis, 19, p. 413-424. 

10. Pour plus details a ce sujet, on consultera: Dixit, A.K. et R.S. Pindyck (1994), 
Investment under Uncertainty, Princeton University Press, Princeton, chap. 3 et 4. 
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ou a(.) designe le drift et ou dz suit un processus de Wiener, c’est-a- 
dire: dz = e ~ N(0, l) 11 . Le processus stochastique x(t), defini 

par l’equation precedente, est appele processus d’lto. 

Considerons l’esperance et la variance de dx. L’esperance de dx est 
egale a: 

E(dx) = a(x,t)dt 

puisque E(dz) = 0. La variance de dx est egale a: 

V(dx) = E(dx) 2 - (E(dx)) 2 

Cette variance contient des termes en dt, en (dt) 2 et en (dt)(dz), ce 
produit etant de l’ordre (dt) 3/2 . Comme dt est infinitesimalement 
petit, les termes en (dt) 2 et en (dt) 3/2 peuvent etre ignores. La variance 
de dx est done de: 


V(dx) = b 2 (x,t)dt 

On appelle a(x, t) le drift instantane du processus d’lto et b 2 (x, t), la 
variance instantanee. 

Un cas special du processus d’lto est le mouvement brownien 
geometrique qui s’ecrit comme suit: 

dx = axdt + axdz 

Nous nous interessons maintenant a la relation entre x et son loga- 
rithme. Soit: F(x) = log(x). En appliquant le lemme d’lto etudie aupa- 
ravant, l’equation differentielle de F est la suivante: 


dF = 



dt + a dz 


11. L’esperance mathematique d’un processus de Wiener est done de: E(dz) = 0, et 
sa variance: V(dz) = E[(dz) 2 ] = dt. Par consequent, Pecart-type de dz est de fdt, 
ce qui revient a dire que l’incertitude augmente avec la racine carree du temps. 
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En appliquant les regies anterieures, on calcule que le changement 
dans le Iogarithme de x est distribue normalement avec une esperance 

—a 2 jt et une variance cr 2 t. On peut montrer que l’esperance de 
x(t) est egale a: 

E[x(t)] = x 0 e at 

et sa variance: 


V[ x (t)] = x 5e 2 “(e" ! '-ll 


Ces resultats sont d’une grande utilite pour calculer l’esperance 
d’un mouvement geometrique brownien: 


E 


|x(t)e rt dt 
.0 


Jx 0 e (r a)t dt = x 0 (r-a) 
o 


Les mouvements browniens geometriques on une grande utilite dans 
la modelisation des variables financieres comme les prix des titres et 
les taux d’interet. 

Nous sommes maintenant en mesure d’aborder les processus 
browniens de retour vers la moyenne, dits encore processus Ornstein- 
Uhlenbeck. Ces processus sont tres plausibles pour modeliser certaines 
variables financieres qui ont tendance a retourner a long terme vers 
n n niveau dit normal , tels les taux d’interet. L’equation differentielle 
generale de tels processus est la suivante: 

dx = 0(x - x)dt + adz 


q: vitesse de retour a la moyenne 

x: niveau normal de x (niveau auquel il retourne a long terme) 

Calculons l’esperance mathematique et la variance d’un processus de 
retour vers la moyenne. L’esperance de x t est egale a: 

E(x t ) = x + (x 0 -x)e _8t 
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Et sa variance: 


y( x t -x) = — (l-e- 26t ) 

29 V ’ 

On se rend compte que la valeur esperee de x t tend vers x quand 

t —> °° et que sa variance converge vers —. Si 0—>°°, alors 
. , 20 
V(x t ) —» 0, c’est-a-dire que x t ne devie jamais dex, meme temporai- 

rement. Par ailleurs, si 0 —> 0, alors V(x t ) a 2 t. x t suit dans ce cas 
un mouvement brownien simple a la limite. 

Broze et al. (1993) 12 ont ecrit une forme generale pour les pro¬ 
cessus browniens de taux d’interet qui synthetise l’ensemble des mo- 
deles bien connus. Cette forme est la suivante: 

dr t = (a + (3r t )dt + a 0 ^r t Y + )dW t 

Le tableau 11.1, tire de Broze et al. (1993), montre comment cette 
forme generale integre les modeles stochastiques de taux d’interet 
bien connus. 

Pour estimer les parametres d’un processus brownien de retour 
vers la moyenne, nous devons discretiser un tel processus. En fait, le 
processus continu est la valeur limite quand At —» °o du processus 
autoregressif suivant en temps discret: 



12. Broze, L., O. Scaillet et J.-M. Zakoian (1993), «Testing for Continuous-Time 
Models of the Short-Term Interest Rate », Centre d’economie mathematique et 
d’econometrie, Universite de Bruxelles. 
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Tableau 11.1 Modeles stochastiques de taux d’interet 


Modele 

a 

P 

CTO 

CTl 

7 

Merton (1973) 
dr = adt + a 0 dW t 


0 


0 

0 

Vasicek (1977) 
dr t = (a + (3r t )dt + a () dW t 




0 

0 

Cox, Ingersoll et Ross (1985) 
dr t = (a + (3r t )dt +a Q jr^dW t 




0 

1 

2 

Dothan (1978) 
dr t = o 0 r t dW t 

0 

0 


0 

1 

Processus brownien geometrique 
dr t = (3r t dt + o 0 r t dW t 

0 



0 

1 

Brennan et Schwartz (1980) 
dr t = (a + (3r t )dt + o 0 r t dW t 




0 

1 

Cox, Ingersoll et Ross (1980) 
dr t = o 0 r t 2 dW t 

0 

0 


0 

3 

2 

Elastitite constante de la variance 
dr t = (3r t dt + cr 0 r t Y dW t 

0 



0 


Chan, Karolyi, Longstaff et Sanders (1992) 
dr t = (a + (3r t )dt + a 0 r t Y dW t 



0 



On peut done estimer les parametres d’un processus brownien de 
retour vers la moyenne en utilisant des donnees discretes et en recou- 
rant a l’equation suivante: 


x t - x t _j = a + bx t _j + e t 

On peut recuperer facilement la structure initiale du mouvement 
brownien comme suit, en sachant que a = x|l-e _ ®j et b = e _ ® -l, 
x est egal a 1’expression suivante: 
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En procedant de la sorte, on trouve: 


6 


dog(: 


1 + b 


et 


a = a E 



II est facile de generaliser le processus brownien de retour vers la 
moyenne qui vient d’etre expose. Par exemple, on peut supposer que 
x t retoume vers x a long terme, mais que la variance du processus 
augmente avec x. Le processus brownien s’ecrit dans ce cas: 


dx = 0(x - x)dt + ax dz 


Avant de poursuivre, nous ouvrons une parenthese sur les proce¬ 
dures de discretisation puisque l’on doit utiliser de telles procedures 
pour passer de la forme theorique d’une equation differentielle sto- 
chastique, generalement exprimee en temps continu et qui ne se prete 
pas comme telle a l’estimation empirique, a sa forme discrete, qui peut 
alors faire l’objet d’une estimation 13 . 

Soit une equation de la forme suivante: 


dx(t) = adt + bdW t 


ou W t designe un processus de Wiener. Cette equation est exprimee 
en temps continu et on desire la discretiser. Nous envisageons dans un 
premier temps la discretisation de premier ordre, encore appelee 
discretisation d’Euler. Ce type de discretisation est qualifie de crude 
par Gourieroux (1996), car elle n’est pas une forme de discretisation 
exacte, forme que nous avons exposee anterieurement pour le proces¬ 
sus Omstein-Uhlenbeck 14 . La discretisation d’Euler et la discretisation 


13. Pour cette section, nous nous inspirons de: Jegadeesh, N. et B. Tuckman (2000), 
Advanced Fixed-Income Valuation Tools, John Wiley and Sons, New York, chap. 13. 

14. Voir a cet effet: Gourieroux, C. et A. Montfort (1996), Simulation-Based Econo¬ 
metric Methods, Oxford University Press, Oxford, chap. 6. Ce chapitre est excellent 
en ce qui concerne l'estimation d’equations differentielles stochastiques a partir 
de donnees discretes ou de conditions de moments. 
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exacte sont toutefois reconciliables, comme le lecteur sera a meme de 
le constater 15 . 

Pour ce qui conceme l’approximation d’Euler, l’idee de base est 
ici d’approximer une equation differentielle stochastique par une serie 
de Taylor du premier degre. Pour ce faire, on divise l’intervalle [0 , T] 
en k sous-intervalles identiques de longueur h. L’approximation 
d’Euler de la fonction differentielle stochastique dx t est de: 

5 k + i-Xk =ah + bz k+I Vh 

ou z~N(0, 1). Cette equation fournit une approximation pour la 
distribution de x k+1 . L’approximation est plus precise quand h —> 0. 

Comme nous l’avons mentionne auparavant, Broze et al. (1993) 
ont ecrit une forme generale pour les mouvements browniens de taux 
d’interet, c’est-a-dire: 


dr t = (a + (3r t )dt + a 0 (r t Y + )dW t 
La discretisation d’Euler de cette equation est la suivante: 

= « h + (p h + l)r t (h) + a 0>h (jr t (h) | Y + a 1;h jz t+1 

ou (Z,) est une sequence de variables gaussiennes independantes et 
oil: 


a h =ah;p h =ph;a 0) h =o 0 Vh;a 1)h = a t 

Comme cela vient d’etre mentionne, l’approximation d’Euler est 
une approximation de Taylor du premier degre aux variations obser¬ 
vers de x(t). Mais on peut obtenir une discretisation plus precise et qui 
converge plus rapidement en recourant a une serie de Taylor du 
second degre pour convertir en temps discret la variation de x(t). 
Cette procedure est appelee scheme de Milstein. Elle s’applique lorsque 
les parametres de 1’equation differentielle dependent de x et de t. Mais 
du fait des differences entre le calcul differentiel classique et le calcul 


15. En fait, la discretisation exacte permet d’identifier les coefficients d’un processus 
brownien dont la version continue a ete discretisee par une approximation d’Euler 
pour des fins d’estimation. 
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differentiel stochastique, le scheme de Milstein est beaucoup plus 
complexe que les schemes de second degre generalement utilises dans 
le cas des equations differentielles ordinaires ou non stochastiques. 
Les schemes de Milstein debordent de l’objet de 1’actuel Traite d’e'co- 
nometriefinanciere. Pour plus de details a ce sujet, le lecteur se referera 
a Jegadeesh et Tuckman (2000). 

Forts de ces developpements, nous pouvons maintenant envi- 
sager l’estimation du modele de Schaefer et Schwartz (SS), un modele 
bifactoriel de taux d’interet. Les deux facteurs sont le taux a long 
terme et 1’ecart de rendement qui est la difference entre le taux a long 
terme et le taux a court terme. Ils utilisent 1’ecart de rendement plutot 
que le taux a court terme, car il a ete demontre empiriquement que 
1’ecart de rendement est orthogonal au taux a long terme, ce qui 
facilite l’estimation. Le modele SS s’ecrit comme suit: 

ds = m(p.-s)dt + ydz t 
dl = (3 2 dt + aVTdz 2 

dzjdz 2 = 0 

ou s est 1’ecart de rendement, 1 est le taux a long terme, m est le 
coefficient de retour vers la moyenne pour 1’ecart de rendement, p. est 
la moyenne a long terme de 1’ecart de rendement, y est le coefficient 
de variance pour 1’ecart de rendement, s est le coefficient de variance 
pour le taux a long terme et b 2 represente la tendance (drift) du taux 
a long terme. 

Envisageons d’abord l’estimation des deux equations du modele 
de SS par la methode des MCO. Considerons d’abord l’equation de 
1’ecart de rendement: 


ds t = m(u-s t )dt +ydw t 

La discretisation d’Euler de cette equation est la suivante: 

s t -s t _! = m*(u*-y t _ 1 ) +y*e* t =m*u*-m*y t _! 
+y*e* t = c + m* *y t _j + e * * t 
or, la discretisation exacte de ds t est la suivante: 

s t - s t _j = u(l - e~ m ) + (e -m -1) s t _j + e t 
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On peut estimer cette demiere equation par les MCO de la fagon 
suivante: 


s t — s t _j = a + bs,.^ +E t 

ce qui est un processus autoregressif d’ordre 1. En comparant la dis¬ 
cretisation d’Euler avec la discretisation exacte, on identifie les para- 
metres de 1’equation initiale comme suit: 


u = - — 

b 


a = 


a e 


2log(l + b) 



Pour estimer cette equation, nous avons utilise des donnees men- 
suelles canadiennes s’etirant de 1949 a 1999. Le taux a court terme 
retenu est celui des bons du Tresor a trois mois et celui a long terme, 
le taux des obligations federales a dix ans. Nous avons d’abord estime 
la premiere equation du modele de SS selon la methode des MCO. 
Les resultats apparaissent au tableau 11.2. 

Comme on peut le constater, les deux coefficients estimes a et b 
sont hautement significatifs, a en juger par le niveau des statistiques t 
et des p-values. L’ecart de rendement a long terme est egal, en vertu 
de la discretisation exacte a: 

u = -4 = 1,2486 
b 
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Tart, fait 11.2 


System: STRUC 

Estimation Method : Least Squares 

Date : 04/26/00 Time : 19:00 

Sample: 2 627 

Included observations: 626 

Total system (balanced) observations 1252 


Coefficient 

Std. Error t-Statistic 

Prob. 

C(1) 

0.043168 

0.020411 2.114887 

0.0346 

C(2) 

-0.034634 

0.010405 -3.328516 

0.0009 

C(3) 

0.009544 

0.007851 1.215625 

0.2244 

Determinant residual covariance 

0.000911 


Equation: D(SPR)= 

C(1)+C(2)*SPR(-1) 


Observations: 626 




R-squared 

0.017445 

Mean dependent var 

-0.002602 

Ajusted R-squared 

0.015870 

S.D. dependent var 

0.380444 

S.E. of regression 

0.377413 

Sum squared resid 

88.88281 

Durbin-Watson stat 

1.274598 



Equation: D(L)/(L(-1) 

' A (1/2» = C(3)/(L(-1) A (1/2)) 


Observations: 626 




R-squared 

0.000951 

Mean dependent var 

0.003014 

Ajusted R-squared 

0.000951 

S.D. dependent var 

0.080303 

S.E. of regression 

0.080265 

Sum squared resid 

4.026560 

Durbin-Watson stat 

1.324424 




Cette valeur pour l’ecart de rendement sur longue periode entre les 
obligations a dix ans et les bons du Tresor a 3 mois nous conforte dans 
nos attentes, quand on sait que le Canada devait maintenir tradition- 
nellement un ecart de rendement substantiel pour encourager l’offre 
de fonds a long terme, necessaire au financement des tres nombreux 
projets a long terme, le Canada n’ayant pas encore atteint sa periode 
de maturite industrielle comme les Etats-Unis. Ce raisonnement est 
corrobore par l’estimation du meme coefficient par Jagadeesh et 
Tuckman (2000) qui ont obtenu, pour ce meme coefficient, un resultat 
de -0,0171 pour les Etats-Unis, ce qui demontre la maturite indus¬ 
trielle avancee de ce pays. 
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Passons maintenant a l’estimation de la vitesse d’ajustement de 
l’ecart de rendement vers sa valeur de longue periode. Toujours selon 
la discretisation exacte, ce coefficient est egal a: 

m = -log(l + b) = -log(l - 0,0346) = 0,0352 

Nous prenons done acte que la vitesse d’ajustement de l’ecart de 
rendement est plutot lente. Ce resultat etait attendu, car on sait que 
cet ecart peut devier de sa moyenne pendant de longues periodes de 
temps au Canada. Ce resultat est appuye par l’estimation de l’ecart- 
type du mouvement brownien de l’ecart de rendement canadien dont 
nous donnons maintenant le resultat. 


L’ecart-type estime de l’equation de l’ecart de rendement est 
egal a: 


y = a e 


| 21 °g( 1 + fc ) „ J774 | 21o g (0,9654) _ 
|(l + b) 2 -l ’ l|(0,9654) 2 -l 


L’ecart-type estime de l’equation stochastique de l’ecart de rende¬ 
ment, soit y, est done relativement important, ce qui implique que 
l’ecart de rendement peut devier de sa valeur a long terme pendant 
une periode de temps appreciable. 

Envisageons maintenant I’estimation de Pequation stochastique 
de la differentielle du taux a long terme du modele SS, soit: 

dl = udt + cVTdW 

Pour etre en mesure d’estimer cette equation differentielle stochas¬ 
tique, nous recourons a la discretisation d’Euler. A la suite de cette 
discretisation, cette demiere equation s’ecrit: 


l t — l t _! =u + o- s jl t _ l e t 


Cette equation incorpore a 1’evidence une forme d’heteroscedasticite 
conditionnelle. Pour y pallier, nous ponderons chacune des observa¬ 


tions des variables de I’equation par 



. A la suite de cette trans¬ 


formation, l’equation differentielle de la variation du taux a long 
terme devient: 
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L-L, U 


u 



ou e t * = ae t . Nous estimons cette equation en recourant dans un 
premier temps aux moindres carres ponderes. 

Comme cela apparait au tableau 11.2, la valeur estimee de u, soit 
la valeur a long terme ou drift de la differentielle du taux a long terme, 
est egale a 0,0095 et n’est pas significative au seuil a = 5%. Pour 
estimer le u de l’equation differentielle stochastique du taux a long 
terme, nous recourons au resultat suivant: 


V(e t *) = V(a£ t ) = a 2 V(e t ) = a 2 

puisque e t ~ N(0, l). L’ecart-type cr qui apparait dans 1’equation dif¬ 
ferentielle stochastique est done egal a l’ecart-type du terme d’erreur 
de la regression effectuee, qui est egal a: 0,0802 16 . 

Comme le modele de SS comporte deux equations, nous avons 
egalement estime ses parametres en recourant a la methode des doubles 
moindres carres. Les variables instrumentales retenues sont des deca- 
lages sur l’ecart de rendement entre les obligations federates a long 
terme americaines et le taux de rendement des bons du Tresor ame- 
ricain. Cet ecart semblait en effet bien jouer son role de variable 
instrumentale, a savoir une correlation elevee avec les variables endo- 
genes du modele et une orthogonalite avec les termes d’erreur des 
equations du modele. 

Les resultats de cette estimation apparaissent au tableau 11.3. 

En refaisant les calculs precedents pour identifier les parametres 
des equations du modele de SS, le lecteur sera a meme de constater 
que les resultats de cette estimation ne different pas sensiblement de 
ceux obtenus par la methode des moindres carres ponderes. 


16. A remarquer que, pour ce qui concerne l’equation differentielle stochastique du 
taux a long terme, les coefficients dont les valeurs sont donnees dans le texte 
correspondent a la discretisation d’Euler et non a la discretisation exacte. 
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Tart, fait 11.3 


System: STRUC 

Estimation Method : Two-Stage Least Squares 

Date : 04/26/00 Time : 19:00 

Sample: 4 627 

Included observations: 624 

Total system (balanced) observations 1248 



Coefficient 

Std. Error t-Statistic 

Prob. 

C(1) 

0.077456 

0.020874 3.710549 

0.0002 

C(2) 

-0.061026 

0.010851 -5.623929 

0.0000 

C(3) 

0.008725 

0.007933 1.099815 

0.2716 

Determinant residual covariance 

0.000924 


Equation: D(SPR)= 

C(1)+C(2)*SPR(-1) 


Observations: 624 




R-squared 

0.007758 

Mean dependent var 

-0.002979 

Ajusted R-squared 

0.006163 

S.D. dependent var 

0.380993 

S.E. of regression 

0.379817 

Sum squared resid 

89.73033 

Durbin-Watson stat 

1.230532 



Equation: D(L)/(L(-1) 

' A (1/2» = C(3)/(L(-1) A (1/2)) 


Observations: 624 




R-squared 

0.000788 

Mean dependent var 

0.002804 

Ajusted R-squared 

0.000788 

S.D. dependent var 

0.080341 

S.E. of regression 

0.080309 

Sum squared resid 

4.018078 

Durbin-Watson stat 

1.326180 




Nous en arrivons maintenant a l’objet principal de cette section, 
soit l’estimation des parametres du modele de SS par la methode du 
GMM 17 . Comme nous l’avons vu auparavant, cette methode exige 
l’estimation d’une matrice de ponderation des moments, appelons-la 

17. Les conditions d’orthogonalite ou moments du modele de SS sont les suivantes: 
E[e s Z t _! ] = 0; e[(e 2 - Y 2 )z t _! ] = 0; E[e,Z M ] = 0; E^e 2 - o 2 l)Z t _! ] = 0; 
E^BjE! - pcryvTjZ t _| J = 0, ou Z t _i designe la matrice des variables instrumen- 
tales decalees d’une periode; e Sj le terme d’erreur de la regression de l’ecart de 
rendement; ei, le terme d’erreur de la regression du taux a long terme et p, la 
correlation entre e s et sj. 
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ft 1 , ou ft est la matrice variance-covariance des moments. Le logiciel 
EViews 3.1 offre plusieurs options pour estimer ft. 

i) La matrice de White, encore appelee HCCM (. Hetero- 
skedasticity Consistent Covariance Matrix ). Nous avons deja 
fraye avec cette matrice. Rappelons ici le principe de sa 
construction dans le contexte de la methode du GMM. 

Soit les moments suivants, qui sont en fait des conditions 
d’orthogonalite entre le vecteur des variables instrumentales 
Z retenu pour l’estimation et les residus de la regression: 

m(0,y,X,z) = Z T u(0,y,X) = 0 

ou 0 est le vecteur des parametres a estimer. Par exemple, pour 
l’estimateur des MCO, la condition d’orthogonalite est: 

X T (y-X(3) = 0 

Pour des raisons d’identification des parametres, il faut que 
le nombre de variables instrumentales soit au moins egal au 
nombre de parametres a estimer. 

Si la matrice de White est retenue pour calculer les moments, 
EViews calcule cette matrice comme suit: 

ft=—y zju t ujz 
T-kfe 

ou u t est le vecteur des residus estimes 18 . 

ii) La matrice dite HAC ( heteroskedastic and autocorrelation consis¬ 
tent covariance matrix). Pour les aspects techniques de la cons¬ 
truction de cette matrice, nous reportons le lecteur au manuel 
de reference du logiciel EViews. Cette construction repose 
entre autres sur le recours a des kernels de fagon a ce que la 
matrice HAC soit semi-definie positive. 

L’estimation des parametres du modele de SS par la methode 
du GMM apparait au tableau 11.4. 


18. Pour un expose plus elabore de la matrice de White dans le contexte de la 
methode du maximum de vraisemblance, on consultera: Hendry, D.F. (1995), 
Dynamic Econometrics: Advanced Texts in Econometrics, Oxford University Press, 
Oxford, chap. 10, section 10.10. 


© 2001 - Presses de l’Universite du Quebec 

Edifice U Delta T. 2W5, boat limner, bureau 450, Quebec, Quebec G1V 2M2 • Tgl (418) 657-4399 - www pug ca 

Tird : Traite d'econometrie financiere, Frangois-Eric Racicot et Raymond Thdoret, ISBN 2-7605-1123-5 • D1123N 




La methode des moments generalises 349 


Tart,fait 11.4 


System: STRUC 

Estimation Method: Generalized Method of Moments 

Date : 04/26/00 Time : 19:00 

Sample: 4 627 

Included observations: 624 

Total system (balanced) observations 1248 

No prewhitening 

Bandwidth: Fixed (6) 

Kernel: Bartett 

Convergence achieved after: 4 weight matrices. 5 total coef iterations 



Coefficient 

Std. Error 

t-Statistic 

Prob. 

C(1) 

C(2) 

C(3) 

0.076434 

-0.054968 

0.015096 

0.028534 

0.015209 

0.007348 

2.678673 

-3.614102 

2.054310 

0.0075 

0.0003 

0.0402 

Determinant residual covariance 
J-statistic 

0.000921 

0.013064 



Equation: D(SPR)= 
Observations: 624 

C(1)+C(2)*SPR(-1) 



R-squared 

Ajusted R-squared 
S.E. of regression 
Durbin-Watson stat 

0.011489 

0.009899 

0.379102 

1.242401 

Mean dependent var 
S.D. dependent var 

Sum squared resid 

-0.002979 

0.380993 

89.39297 

Equation: D(L)/(L(-1) 
Observations: 624 

'*(1/2)) = C(3)/(L(-1)A(l/2)) 



R-squared 

Ajusted R-squared 
S.E. of regression 
Durbin-Watson stat 

-0.000229 

-0.000229 

0.080350 

1.324358 

Mean dependent var 
S.D. dependent var 

Sum squared resid 

0.002804 

0.080341 

4.022167 


On remarquera que les trois coefficients estimes sont maintenant 
significatifs, ce qui n’etait pas le cas pour les deux autres methodes 
d’estimation. Les resultats de cette estimation se rapprochent de ceux 
de la methode des doubles moindres carres. 
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L’estimation des parametres des equations differentielles stochas- 
tiques trouve un tres grand nombre duplications dans le domaine de 
la theorie des produits derives. Par exemple, les scenarios de taux 
d’interet, qui entrent dans la determination des prix des produits 
derives, font appel a de tels parametres. II faut egalement recourir a de 
tels parametres pour evaluer les prix des obligations qui entrent dans 
revaluation des options sur taux d’interet. Dans le modele de SS, le 
prix d’une obligation se calcule comme suit, une fois les parametres du 
modele stochastique de taux d’interet estimes: 


P(s,l,x) = X(s,x)Y(l,x) 

x( s ,x)= e [ c(T) - sD(x) i 


C(t) 



(mp-Xy)-y 2 

2 


y 2 D 2 

4m 


, x 1 - e mT 

D(x) =- 

m 

y(i,x) = el AW - 1BW l 


A(x) 

B (4 


2ae^ s+ 

a)r/2 

(s + a)(e“ T 

-l) + 2a 

2 ( eCXT " 

') 

(s + a)(e m ~ 

>)+2a 


a = Vs 2 +2a 2 

ou t designe 1’echeance de l’obligation et s est defini implicitement 
par 1’equation suivante: 




. l 0 s-a 



s 
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Par simulation, Jegadeesh et Tuckman (2000) ont obtenu une valeur 
de 0,7 pour X, soit le prix du risque. 

Test sur les restrictions de suridentification 

Un modele GMM est suridentifie quand le nombre des conditions 
d’orthogonalite est superieur au nombre de parametres a estimer. 
Hansen (1982) a suggere un test pour verifier si les moments 
echantillonnaux ne sont pas significativement differents de 0. Si les 
conditions d’orthogonalite de la population sont toutes vraies, alors: 

[VTg(e 0 ;y T )] T w[VTg(e 

o;y-r)]~x 2 ( r ) 

ou g(.) designe le vecteur des r conditions d’orthogonalite. Dans cette 
equation, la fonction g(.) est evaluee a la vraie valeur qo. Par ailleurs, 

l’estimateur GMM, designe par 0 T , est typiquement une solution au 
systeme suivant: 



ou a designe le nombre de parametres a estimer. Comme le systeme 
est suridentifie, r > a, on pourrait penser que l’expression anterieure 
ayant trait a la distribution asymptotique des moments ponderes vaut 
egalement lorsque le tout est evalue a 0 T . Mais cela est faux puisque 

le vecteur g^Q-r IYt ) contient (r - a) variables aleatoires non degene- 
rees 19 . Evaluee a 0 T , la distribution asymptotique des moments est 
plutot de: 

[VTg(0 T ;y T )] T W[ VTg(e x ; y x )]i X 2 (r - a) 


19. Pour la preuve de ce resultat, voir: Hamilton, J.D. (1994), op. tit. 
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Le calcul de la statistique du test est trivial puisqu’elle est egale au 
produit de T et de la valeur de la fonction critere GMM evaluee a 0 T . 
Ce test sert a verifier si le modele est bien specifie ou non. Mais selon 
Hamilton (1994), il faut complementer ce test car il peut facilement 
echouer. 

Les hypotheses de ce test sont les suivantes: 

HO : les conditions d’orthogonalite ne sont pas significativement 
differentes de 0. 

HI : les conditions d’orthogonalite sont significativement diffe¬ 
rentes de 0, auquel cas le modele est mal specifie. 

Si la statistique x 2 calculee excede la % 2 au seuil retenu, alors on 
rejette HO en faveur de HI. 
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Tableau A. 1 Repartition de la loi normale 
centree reduite 

Les chiffres figurant dans le tableau donnent le rapport 
entre la surface en dessous de la courbe, comprise entre 
0 et z et la surface totale se trouvant en dessous de 
cette courbe. Si z est negatif, on procede par symetrie. 



z 

0,00 

0,01 

0,02 

0,03 

0,04 

0,05 

0,06 

0,07 

0,08 

0,09 

0,0 

,0000 

,0040 

,0080 

,0120 

,0160 

,0199 

,0239 

,0279 

,0319 

,0359 

0,1 

,0398 

,0438 

,0478 

,0517 

,0557 

,0596 

,0636 

,0675 

,0714 

,0753 

0,2 

,0793 

,0832 

,0871 

,0910 

,0948 

,0987 

,1026 

,1064 

,1103 

,1141 

0,3 

,1179 

,1217 

,1255 

,1293 

,1331 

,1368 

,1406 

,1443 

,1480 

,1517 

0,4 

,1554 

,1591 

,1628 

,1664 

,1700 

,1736 

,1772 

,1808 

,1844 

,1879 

0,5 

,1915 

,1950 

,1985 

,2019 

,2054 

,2088 

,2123 

,2157 

,2190 

,2224 

0,6 

,2257 

,2291 

,2324 

,2357 

,2389 

,2422 

,2454 

,2486 

,2517 

,2549 

0,7 

,2580 

,2611 

,2642 

,2673 

,2703 

,2734 

,2764 

,2794 

,2823 

,2852 

0,8 

,2881 

,2910 

,2939 

,2967 

,2995 

,3023 

,3051 

,3078 

,3106 

,3133 

0,9 

,3159 

,3186 

,3212 

,3238 

,3264 

,3289 

,3315 

,3340 

,3365 

,3389 

1,0 

,3413 

,3438 

,3461 

,3485 

,3508 

,3531 

,3554 

,3577 

,3599 

,3621 

1,1 

,3643 

,3665 

,3686 

,3708 

,3729 

,3749 

,3770 

,3790 

,3810 

,3830 

1,2 

,3849 

,3869 

,3888 

,3907 

,3925 

,3944 

,3962 

,3980 

,3997 

,4015 

1,3 

,4032 

,4049 

,4066 

,4082 

,4099 

,4115 

,4131 

,4147 

,4162 

,4177 

1,4 

,4192 

,4207 

,4222 

,4236 

,4251 

,4265 

,4279 

,4292 

,4306 

,4319 

1,5 

,4332 

,4345 

,4357 

,4370 

,4382 

,4394 

,4406 

,4418 

,4429 

,4441 

1,6 

,4452 

,4463 

,4474 

,4484 

,4495 

,4505 

,4515 

,4525 

,4535 

,4545 

1,7 

,4554 

,4564 

,4573 

,4582 

,4591 

,4599 

,4608 

,4616 

,4625 

,4633 

1,8 

,4641 

,4649 

,4656 

,4664 

,4671 

,4678 

,4686 

,4693 

,4699 

,4706 

1,9 

,4713 

,4719 

,4726 

,4732 

,4738 

,4744 

,4750 

,4756 

,4761 

,4767 

2,0 

,4772 

,4778 

,4783 

,4788 

,4793 

,4798 

,4803 

,4808 

,4812 

,4817 

2,1 

,4821 

,4826 

,4830 

,4834 

,4838 

,4842 

,4846 

,4850 

,4854 

,4857 

2,2 

,4861 

,4864 

,4868 

,4871 

,4875 

,4878 

,4881 

,4884 

,4887 

,4890 

2,3 

,4893 

,3896 

,4898 

,4901 

,4904 

,4906 

,4909 

,4911 

,4913 

,4916 

2,4 

,4918 

,4920 

,4922 

,4925 

,4927 

,4929 

,4931 

,4932 

,4934 

,4936 

2,5 

,4938 

,4940 

,4941 

,4943 

,4945 

,4946 

,4948 

,4949 

,4951 

,4952 

2,6 

,4953 

,4955 

,4956 

,4957 

,4959 

,4960 

,4961 

,4962 

,4963 

,4964 

2,7 

,4965 

,4966 

,4967 

,4968 

,4969 

,4970 

,4971 

,4972 

,4973 

,4974 

2,8 

,4974 

,4975 

,4976 

,4977 

,4977 

,4978 

,4979 

,4979 

,4980 

,4981 

2,9 

,4981 

,4982 

,4982 

,4983 

,4984 

,4984 

,4985 

,4985 

,4986 

,4986 

3,0 

,4987 

,4987 

,4987 

,4988 

,4988 

,4989 

,4989 

,4989 

,4990 

,4990 


Tire de P.G. Hoel, Introduction to Mathematical Statistics, 4th edition, Wiley, 1971, avec la 
permission de l’editeur. 
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Tart,fait A.2 Repartition du t 
de Student 

La premiere colonne donne le nombre des 
degres de liberte (v). Les autres colonnes 
correspondent a la probabilite P que t 
depasse les valeurs donnees. Pour des t 
negatifs, on precede par symetrie. 



v 

P 

0,10 

0,05 

0,025 

0,1 

0,005 

1 


3,078 

6,314 

12,706 

31,821 

63,657 

2 


1,886 

2,920 

4,303 

6,965 

9,925 

3 


1,638 

2,353 

3,182 

4,541 

5,841 

4 


1,533 

2,132 

2,776 

3,747 

4,604 

5 


1,476 

2,015 

2,571 

3,365 

4,032 

6 


1,440 

1,943 

2,447 

3,143 

3,707 

7 


1,415 

1,895 

2,365 

2,998 

3,499 

8 


1,397 

1,860 

2,306 

2,896 

3,355 

9 


1,383 

1,833 

2,262 

2,821 

3,250 

10 


1,372 

1,812 

2,228 

2,764 

3,169 

11 


1,363 

1,796 

2,201 

2,718 

3,106 

12 


1,356 

1,782 

2,179 

2,681 

3,055 

13 


1,350 

1,771 

2,160 

2,650 

3,012 

14 


1,345 

1,761 

2,145 

2,624 

2,977 

15 


1,341 

1,753 

2,131 

2,602 

2,947 

16 


1,337 

1,746 

2,120 

2,583 

2,921 

17 


1,333 

1,740 

2,110 

2,567 

2,898 

18 


1,330 

1,734 

2,101 

2,552 

2,878 

19 


1,328 

1,729 

2,093 

2,539 

2,861 

20 


1,325 

1,725 

2,086 

2,528 

2,845 

21 


1,323 

1,721 

2,080 

2,518 

2,831 

22 


1,321 

1,717 

2,074 

2,508 

2,819 

23 


1,319 

1,714 

2,069 

2,500 

2,807 

24 


1,318 

1,711 

2,064 

2,492 

2,797 

25 


1,316 

1,708 

2,060 

2,485 

2,787 

26 


1,315 

1,706 

2,056 

2,479 

2,779 

27 


1,314 

1,703 

2,052 

2,473 

2,771 

28 


1,313 

1,701 

2,048 

2,467 

2,763 

29 


1,311 

1,699 

2,045 

2,462 

2,756 

30 


1,310 

1,697 

2,042 

2,457 

2,750 

40 


1,303 

1,684 

2,021 

2,423 

2,704 

60 


1,296 

1,671 

2,000 

2,390 

2,660 

120 


1,289 

1,658 

1,980 

2,358 

2,617 

oo 


1,282 

1,645 

1,960 

2,326 

2,576 


Tire de P.G. Hoel, Introduction to Mathematical Statistics, 4th edition, Wiley, 1971, avec la 
permission de l’editeur. 
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Tableau A.3 Repartition du x 2 

Pour un nombre de degres de liberte superieur 
a 30, l’expression suit approximativement 
une loi normale centree reduite 
(n etant le nombre de degres de liberte). 


Degres de liberte 

0,99 

0,98 

0,95 

0,90 

0,80 

0,70 

1 

0,000157 

0,000628 

0,00393 

0,0158 

0,0642 

0,148 

2 

0,0201 

0,0404 

0,103 

0,211 

0,446 

0,713 

3 

0,115 

0,185 

0,352 

0,584 

1,005 

1,424 

4 

0,297 

0,429 

0,711 

1,064 

1,649 

2,195 

5 

0,554 

0,752 

1,145 

1,610 

2,343 

3,000 

6 

0,872 

1,134 

1,635 

2,204 

3,070 

3,828 

7 

1,239 

1,564 

2,167 

2,833 

3,822 

4,671 

8 

1,646 

2,032 

2,733 

3,490 

4,594 

5,527 

9 

2,088 

2,532 

3,325 

4,168 

5,380 

6,393 

10 

2,558 

3,059 

3,940 

4,865 

6,179 

7,267 

11 

3,053 

3,609 

4,575 

5,578 

6,989 

8,148 

12 

3,571 

4,178 

5,226 

6,304 

7,807 

9,034 

13 

4,107 

4,765 

5,892 

7,042 

8,634 

9,926 

14 

4,660 

5,368 

6,571 

7,790 

9,467 

10,821 

15 

5,229 

5,985 

7,261 

8,547 

10,307 

11,721 

16 

5,812 

6,614 

7,962 

9,312 

11,152 

12,624 

17 

6,408 

7,255 

8,672 

10,085 

12,002 

13,531 

18 

7,015 

7,906 

9,390 

10,865 

12,857 

14,440 

19 

7,633 

8,567 

10,117 

11,651 

13,716 

15,352 

20 

8,260 

9,237 

10,851 

12,443 

14,578 

16,266 

21 

8,897 

9,915 

11,591 

13,240 

15,445 

17,182 

22 

9,542 

10,600 

12,338 

14,041 

16,314 

18,101 

23 

10,196 

11,293 

13,091 

14,848 

17,187 

19,021 

24 

10,856 

11,992 

13,848 

15,659 

18,062 

19,943 

25 

11,524 

12,697 

14,611 

16,473 

18,940 

20,867 

26 

12,198 

13,409 

15,379 

17,292 

19,820 

21,792 

27 

12,879 

14,125 

16,151 

18,114 

20,703 

22,719 

28 

13,565 

14,847 

16,928 

18,939 

21,588 

23,647 

29 

14,256 

15,574 

17,708 

19,768 

22,475 

24,577 

30 

14,953 

16,306 

18,493 

20,599 

23,364 

25,508 


Tire de R.A. Fisher, Statistical Methods for Research Workers, 14th ed., New York, Macmillan 
Publishing Co., Inc. 
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Tart,fait A. 3 ( suite ) 


Degres de liberte 0,50 

0,30 

0,20 

0,10 

0,05 

0,02 

0,01 

1 

0,455 

1,074 

1,642 

2,706 

3,841 

5,412 

6,635 

2 

1,386 

2,408 

3,219 

4,605 

5,991 

7,824 

9,210 

3 

2,366 

3,665 

4,642 

6,251 

7,815 

9,837 

11,341 

4 

3,357 

4,878 

5,989 

7,779 

9,488 

11,668 

13,277 

5 

4,351 

6,064 

7,289 

9,236 

11,070 

13,388 

15,086 

6 

5,348 

7,231 

8,558 

10,645 

12,592 

15,033 

16,812 

7 

6,346 

8,383 

9,803 

12,017 

14,067 

16,622 

18,475 

8 

7,344 

9,524 

11,030 

13,362 

15,507 

18,168 

20,090 

9 

8,343 

10,656 

12,242 

14,684 

16,919 

19,679 

21,666 

10 

9,342 

11,781 

13,442 

15,987 

18,307 

21,161 

23,209 

11 

10,341 

12,899 

14,631 

17,275 

19,675 

22,618 

24,725 

12 

11,340 

14,011 

15,812 

18,549 

21,026 

24,054 

26,217 

13 

12,340 

15,119 

16,985 

19,812 

22,362 

25,472 

27,688 

14 

13,339 

16,222 

18,151 

21,064 

23,685 

26,873 

29,141 

15 

14,339 

17,322 

19,311 

22,307 

24,996 

28,259 

30,578 

16 

15,338 

18,418 

20,465 

23,542 

26,296 

29,633 

32,000 

17 

16,338 

19,511 

21,615 

24,769 

27,587 

30,995 

33,409 

18 

17,338 

20,601 

22,760 

25,989 

28,869 

32,346 

34,805 

19 

18,338 

21,689 

23,900 

27,204 

30,144 

33,687 

36,191 

20 

19,337 

22,775 

25,038 

28,412 

31,410 

35,020 

37,566 

21 

20,337 

23,858 

26,171 

29,615 

32,671 

36,343 

38,932 

22 

21,337 

24,939 

27,301 

30,813 

33,924 

37,659 

40,289 

23 

22,337 

26,018 

28,429 

32,007 

35,172 

38,968 

41,638 

24 

23,337 

27,096 

29,553 

33,196 

36,415 

40,270 

42,980 

25 

24,337 

28,172 

30,675 

34,382 

37,652 

41,566 

44,314 

26 

25,336 

29,246 

31,795 

35,563 

38,885 

42,856 

45,642 

27 

26,336 

30,319 

32,912 

36,741 

40,113 

44,140 

46,963 

28 

27,336 

31,391 

34,027 

37,916 

41,337 

45,419 

48,278 

29 

28,336 

32,461 

35,139 

39,087 

42,557 

46,693 

49,588 

30 

29,336 

33,530 

36,250 

40,256 

43,773 

47,962 

50,892 
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Tableau A. 5 Statistique de Durbin et Watson au seuil de 5 % 



K' = 

1 

K' = : 

2 

K' = 

3 

K' = 

4 

K' = 

5 

n 

d L 

dv 

d L 

dv 

d L 

dv 

d L 

dv 

d L 

dv 

6 

0,610 

1,400 









7 

0,700 

1,356 

0,467 

1,896 

- 

- 

- 

- 

- 

- 

8 

0,763 

1,332 

0,559 

1,777 

0,368 

2,287 

- 

- 

- 

- 


0,824 

1,320 

0,629 

1,699 

0,455 

2,128 

0,296 

2,588 

_ 

_ 

10 

0,879 

1,320 

0,697 

1,641 

0,525 

2,016 

0,376 

2,414 

0,243 

2,822 

11 

0,927 

1,324 

0,758 

1,604 

0,595 

1,928 

0,444 

2,283 

0,316 

2,645 

12 

0,971 

1,331 

0,812 

1,579 

0,658 

1,864 

0,512 

2,177 

0,379 

2,506 

13 

1,010 

1,340 

0,861 

1,562 

0,715 

1,816 

0,574 

2,094 

0,445 

2,390 

14 

1,045 

1,350 

0,905 

1,551 

0,767 

1,779 

0,632 

2,030 

0,505 

2,296 

IS 

1,077 

1,361 

0,946 

1,543 

0,814 

1,750 

0,685 

1,977 

0,562 

2,220 

16 

1,106 

1,371 

0,982 

1,539 

0,857 

1,728 

0,734 

1,935 

0,615 

2,157 

17 

1,133 

1,381 

1,015 

1,536 

0,897 

1,710 

0,779 

1,900 

0,664 

2,104 

18 

1,158 

1,391 

1,046 

1,535 

0,933 

1,696 

0,820 

1,872 

0,710 

2,060 

19 

1,180 

1,401 

1,074 

1,536 

0,967 

1,685 

0,859 

1,848 

0,752 

2,023 

20 

1,201 

1,411 

1,100 

1,537 

0,998 

1,676 

0,894 

1,828 

0,792 

1,991 

21 

1,221 

1,420 

1,125 

1,538 

1,026 

1,669 

0,927 

1,812 

0,829 

1,964 

22 

1,239 

1,429 

1,147 

1,541 

1,053 

1,664 

0,958 

1,797 

0,863 

1,940 

23 

1,257 

1,437 

1,168 

1,543 

1,078 

1,660 

0,986 

1,785 

0,895 

1,920 

24 

1,273 

1,446 

1,188 

1,546 

1,101 

1,656 

1,013 

1,775 

0,925 

1,902 

25 

1,288 

1,454 

1,206 

1,550 

1,123 

1,654 

1,038 

1,767 

0,953 

1,886 

26 

1,302 

1,461 

1,224 

1,553 

1,143 

1,652 

1,062 

1,759 

0,979 

1,873 

27 

1,316 

1,469 

1,240 

1,556 

1,162 

1,651 

1,084 

1,753 

1,004 

1,861 

28 

1,328 

1,476 

1,255 

1,560 

1,181 

1,650 

1,104 

1,747 

1,028 

1,850 

29 

1,341 

1,483 

1,270 

1,563 

1,198 

1,650 

1,124 

1,743 

1,050 

1,841 

30 

1,352 

1,489 

1,284 

1,567 

1,214 

1,650 

1,143 

1,739 

1,071 

1,833 

31 

1,363 

1,496 

1,297 

1,570 

1,229 

1,650 

1,160 

1,735 

1,090 

1,825 

32 

1,373 

1,502 

1,309 

1,574 

1,244 

1,650 

1,177 

1,732 

1,109 

1,819 

33 

1,383 

1,508 

1,321 

1,577 

1,258 

1,651 

1,193 

1,730 

1,127 

1,813 

34 

1,393 

1,514 

1,333 

1,580 

1,271 

1,652 

1,208 

1,728 

1,144 


35 

1,402 

1,519 

1,343 

1,584 

1,283 

1,653 

1,222 

1,726 

1,160 

1,803 

36 

1,411 

1,525 

1,354 

1,587 

1,295 

1,654 

1,236 

1,724 

1,175 

1,799 

37 

1,419 

1,530 

1,364 

1,590 

1,307 

1,655 

1,249 

1,723 

1,190 

1,795 

38 

1,427 

1,535 

1,373 

1,594 

1,318 

1,656 

1,261 

1,722 

1,204 

1,792 

39 

1,435 

1,540 

1,382 

1,597 

1,328 

1,658 

1,273 

1,722 

1,218 

1,789 

40 

1,442 

1,544 

1,391 

1,600 

1,338 

1,659 

1,285 

1,721 

1,230 

1,786 

45 

1,475 

1,566 

1,430 

1,615 

1,383 

1,666 

1,336 

1,720 

1,287 

1,776 

50 

1,503 

1,585 

1,462 

1,628 

1,421 

1,674 

1,378 

1,721 

1,335 

1,771 

55 

1,528 

1,601 

1,490 

1,641 

1,452 

1,681 

1,414 

1,724 

1,374 

1,768 

60 

1,549 

1,616 

1,514 

1,652 

1,480 

1,689 

1,444 

1,727 

1,408 

1,767 

65 

1,567 

1,629 

1,536 

1,662 

1,503 

1,696 

1,471 

1,731 

1,438 

1,767 

70 

1,583 

1,641 

1,554 

1,672 

1,525 

1,703 

1,494 

1,735 

1,464 

1,768 

75 

1,598 

1,652 

1,571 

1,680 

1,543 

1,709 

1,515 

1,739 

1,487 

1,770 

80 

1,611 

1,662 

1,586 

1,688 

1,560 

1,715 

1,534 

1,743 

1,507 

1,772 

85 

1,624 

1,671 

1,600 

1,696 

1,575 

1,721 

1,550 

1,747 

1,525 

1,774 

90 

1,635 

1,679 

1,612 

1,703 

1,589 

1,726 

1,566 

1,751 

1,542 

1,776 

95 

1,645 

1,687 

1,623 

1,709 

1,602 

1,732 

1,579 

1,755 

1,557 

1,778 

100 

1,654 

1,694 

1,634 

1,715 

1,613 

1,736 

1,592 

1,758 

1,571 

1,780 

150 

1,720 

1,746 

1,706 

1,760 

1,693 

1,774 

1,679 

1,788 

1,665 

1,802 

200 

1,758 

1,778 

1,748 

1,789 

1,738 

1,799 

1,728 

1,810 

1,718 

1,820 
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Tart,fait A. 5 (suite) 


K' = 6 K' = 7 K' = 8 K' = 9 K’ = 10 


n 

d L 

dv 

d L 

dv 

d L 

dv 

d L 

dv 

d L 

dv 

6 

7 

8 

9 

10 

11 

0,203 

3,005 









12 

0,268 

2,832 

0,171 

3,149 



- 

- 

- 

- 

13 

0,328 

2,692 

0,230 

2,985 

0,147 

3,266 

- 

- 

- 

- 

14 

0,389 

2,572 

0,286 

2,848 

0,200 

3,111 

0,127 

3,360 

_ 

_ 

IS 

0,447 

2,472 

0,343 

2,727 

0,251 

2,979 

0,175 

3,216 

0,111 

3,438 

16 

0,502 

2,388 

0,398 

2,624 

0,304 

2,860 

0,222 

3,090 

0,155 

3,304 

17 

0,554 

2,318 

0,451 

2,537 

0,356 

2,757 

0,272 

2,975 

0,198 

3,184 

18 

0,603 

2,257 

0,502 

2,461 

0,407 

2,667 

0,321 

2,873 

0,244 

3,073 

19 

0,649 

2,206 

0,459 

2,396 

0,456 

2,589 

0,369 

2,783 

0,290 

2,974 

20 

0,692 

2,162 

0,595 

2,339 

0,502 

2,521 

0,416 

2,704 

0,336 

2,885 

21 

0,732 

2,124 

0,637 

2,290 

0,547 

2,460 

0,461 

2,633 

0,380 

2,806 

22 

0,769 

2,090 

0,677 

2,246 

0,588 

2,407 

0,504 

2,571 

0,424 

2,734 

23 

0,804 

2,061 

0,715 

2,208 

0,628 

2,360 

0,545 

2,514 

0,465 

2,670 

24 

0,837 

2,035 

0,751 

2,174 

0,666 

2,318 

0,584 

2,464 

0,506 

2,613 

25 

0,868 

2,012 

0,784 

2,144 

0,702 

2,280 

0,621 

2,419 

0,544 

2,560 

26 

0,897 

1,992 

0,816 

2,117 

0,735 

2,246 

0,657 

2,379 

0,581 

2,513 

27 

0,925 

1,974 

0,845 

2,093 

0,767 

2,216 

0,691 

2,342 

0,616 

2,470 

28 

0,951 

1,958 

0,874 

2,071 

0,798 

2,188 

0,723 

2,309 

0,650 

2,431 

29 

0,975 

1,944 

0,900 

2,052 

0,826 

2,164 

0,753 

2,278 

0,682 

2,396 

30 

0,998 

1,931 

0,926 

2,034 

0,854 

2,141 

0,782 

2,251 

0,712 

2,363 

31 

1,020 

1,920 

0,950 

2,018 

0,879 

2,120 

0,810 

2,226 

0,741 

2,333 

32 

1,041 

1,909 

0,972 

2,004 

0,904 

2,102 

0,836 

2,203 

0,769 

2,306 

33 

1,061 

1,900 

0,994 

1,991 

0,927 

2,085 

0,861 

2,181 

0,795 

2,281 

34 

1,080 

1,891 

1,015 

1,979 

0,950 

2,069 

0,885 

2,162 

0,821 

2,257 

35 

1,097 

1,884 

1,034 

1,967 

0,971 

2,054 

0,908 

2,144 

0,845 

2,236 

36 

1,114 

1,877 

1,053 

1,957 

0,991 

2,041 

0,930 

2,127 

0,868 

2,216 

37 

1,131 

1,870 

1,071 

1,948 

1,011 

2,029 

0,951 

2,112 

0,891 

2,198 

38 

1,146 

1,864 

1,088 

1,939 

1,029 

2,017 

0,970 

2,098 

0,912 

2,180 

39 

1,161 

1,859 

1,104 

1,932 

1,047 

2,007 

0,990 

2,085 

0,932 

2,164 

40 

1,175 

1,854 

1,120 

1,924 

1,064 

1,997 

1,008 

2,072 

0,945 

2,149 

45 

1,238 

1,835 

1,189 

1,895 

1,139 

1,958 

1,089 

2,002 

1,038 

2,088 

50 

1,291 

1,822 

1,246 

1,875 

1,201 

1,930 

1,156 

1,986 

1,110 

2,044 

55 

1,334 

1,814 

1,294 

1,861 

1,253 

1,909 

1,212 

1,959 

1,170 

2,010 

60 

1,372 

1,808 

1,335 

1,850 

1,298 

1,894 

1,260 

1,939 

1,222 

1,984 

, 65 

1,404 

1,805 

1,370 

1,843 

1,336 

1,882 

1,301 

1,923 

1,266 

1,964 

70 

1,433 

1,802 

1,401 

1,837 

1,369 

1,873 

1,337 

1,910 

1,305 

1,948 

75 

1,458 

1,801 

1,428 

1,834 

1,399 

1,867 

1,369 

1,901 

1,339 

1,935 

80 

1,480 

1,801 

1,453 

1,831 

1,425 

1,861 

1,397 

1,893 

1,369 

1,925 

85 

1,500 

1,801 

1,474 

1,829 

1,448 

1,857 

1,422 

1,886 

1,396 

1,916 

90 

1,518 

1,801 

1,494 

1,827 

1,469 

1,854 

1,445 

1,881 

1,420 

1,909 

95 

1,535 

1,802 

1,512 

1,827 

1,489 

1,852 

1,465 

1,877 

1,442 

1,903 

100 

1,550 

1,803 

1,528 

1,826 

1,506 

1,850 

1,484 

1,874 

1,462 

1,898 

150 

1,651 

1,817 

1,637 

1,832 

1,622 

1,847 

1,608 

1,862 

1,594 

1,877 

200 

1,707 

1,831 

1,697 

1,841 

1,686 

1,852 

1,675 

1,863 

1,665 

1,874 
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364 Traite d’econometrie financiere 


Tart,fait A. 5 (suite) 



K' = 

11 

K' = 

12 

K' = 

13 

K' = 

14 

K' = 

15 

n 

d L 

dv 

d L 

dv 

d L 

dv 

d L 

dv 

d L 

dv 

16 

0,098 

3,503 









17 

0,138 

3,378 

0,087 

3,557 

- 

- 

- 

- 

- 

- 

18 

0,177 

3,265 

0,123 

3,441 

0,078 

3,603 

- 

- 

- 

- 

19 

0,220 

3,159 

0,160 

3,335 

0,111 

3,496 

0,070 

3,642 

_ 

_ 

20 

0,263 

3,063 

0,200 

3,234 

0,145 

3,395 

0,100 

3,542 

0,063 

3,676 

21 

0,307 

2,976 

0,240 

3,141 

0,182 

3,300 

0,132 

3,448 

0,091 

3,583 

22 

0,349 

2,897 

0,281 

3,057 

0,220 

3,211 

0,166 

3,358 

0,120 

3,495 

23 

0,391 

2,826 

0,322 

2,979 

0,259 

3,128 

0,202 

3,272 

0,153 

3,409 

24 

0,431 

2,761 

0,362 

2,908 

0,297 

3,053 

0,239 

3,193 

0,186 

3,327 

25 

0,470 

2,702 

0,400 

2,844 

0,335 

2,983 

0,275 

3,119 

0,221 

3,251 

26 

0,508 

2,649 

0,438 

2,784 

0,373 

2,919 

0,312 

3,051 

0,256 

3,179 

27 

0,544 

2,600 

0,475 

2,730 

0,409 

2,859 

0,348 

2,987 

0,291 

3,112 

28 

0,578 

2,555 

0,510 

2,680 

0,445 

2,805 

0,383 

2,928 

0,325 

3,050 

29 

0,612 

2,515 

0,544 

2,634 

0,479 

2,755 

0,418 

2,874 

0,359 

2,992 

30 

0,643 

2,477 

0,577 

2,592 

0,512 

2,708 

0,451 

2,823 

0,392 

2,937 

31 

0,674 

2,443 

0,608 

2,553 

0,545 

2,665 

0,484 

2,776 

0,425 

2,887 

32 

0,703 

2,411 

0,638 

2,517 

0,576 

2,625 

0,515 

2,733 

0,457 

2,840 

33 

0,731 

2,382 

0,668 

2,484 

0,606 

2,588 

0,546 

2,692 

0,488 

2,796 

34 

0,758 

2,355 

0,695 

2,454 

0,634 

2,554 

0,575 

2,654 

0,518 

2,754 

35 

0,783 

2,330 

0,722 

2,425 

0,662 

2,521 

0,604 

2,619 

0,547 

2,716 

36 

0,808 

2,306 

0,748 

2,398 

0,689 

2,492 

0,631 

2,586 

0,575 

2,680 

37 

0,831 

2,285 

0,772 

2,374 

0,714 

2,464 

0,657 

2,555 

0,602 

2,646 

38 

0,854 

2,265 

0,796 

2,351 

0,739 

2,438 

0,683 

2,526 

0,628 

2,614 

39 

0,875 

2,246 

0,819 

2,329 

0,763 

2,413 

0,707 

2,499 

0,653 

2,585 

40 

0,896 

2,228 

0,840 

2,309 

0,785 

2,391 

0,731 

2,473 

0,678 

2,557 

45 

0,988 

2,156 

0,938 

2,225 

0,887 

2,296 

0,838 

2,367 

0,788 

2,439 

50 

1,064 

2,103 

1,019 

2,163 

0,973 

2,225 

0,927 

2,287 

0,882 

2,350 

55 

1,129 

2,062 

1,087 

2,116 

1,045 

2,170 

1,003 

2,225 

0,961 

2,281 

60 

1,184 

2,031 

1,145 

2,079 

1,106 

2,127 

1,068 

2,177 

1,029 

2,227 

65 

1,231 

2,006 

1,195 

2,049 

1,160 

2,093 

1,124 

2,138 

1,088 

2,183 

70 

1,272 

1,986 

1,239 

2,026 

1,206 

2,066 

1,172 

2,106 

1,139 

2,148 

75 

1,308 

1,970 

1,277 

2,006 

1,247 

2,043 

1,215 

2,080 

1,184 

2,118 

80 

1,340 

1,957 

1,311 

1,991 

1,283 

2,024 

1,253 

2,059 

1,224 

2,093 

85 

1,369 

1,946 

1,342 

1,977 

1,315 

2,009 

1,287 

2,040 

1,260 

2,073 

90 

1,395 

1,937 

1,369 

1,966 

1,344 

1,995 

1,318 

2,025 

1,292 

2,055 

95 

1,418 

1,929 

1,394 

1,956 

1,370 

1,984 

1,345 

2,012 

1,321 

2,040 

100 

1,434 

1,923 

1,416 

1,948 

1,393 

1,974 

1,371 

2,000 

1,347 

2,026 

150 

1,579 

1,892 

1,564 

1,908 

1,550 

1,924 

1,535 

1,940 

1,519 

1,956 

200 

1,654 

1,885 

1,643 

1,896 

1,632 

1,908 

1,621 

1,919 

1,610 

1,931 
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Annexe - Tables statistiques 365 


Tart, fait A. 5 (suite) 



K' = 

16 

K' = 

17 

K' = 

18 

K' = 

19 

K' = 

20 

n 

d L 

dv 

d L 

dv 

d L 

dv 

d L 

dv 

d L 

dv 

16 

17 

18 

19 

20 











21 

0,058 

3,705 









22 

0,083 

3,619 

0,052 

3,731 

- 

- 

- 

- 

- 

- 

23 

0,110 

3,535 

0,076 

3,650 

0,048 

3,753 

- 

- 

- 

- 

24 

0,141 

3,454 

0,101 

3,572 

0,070 

3,678 

0,044 

3,773 

- 

- 

25 

0,172 

3,376 

0,130 

3,494 

0,094 

3,604 

0,065 

3,702 

0,041 

3,790 

26 

0,205 

3,303 

0,160 

3,420 

0,120 

3,531 

0,087 

3,632 

0,060 

3,724 

27 

0,238 

3,233 

0,191 

3,349 

0,149 

3,460 

0,112 

3,563 

0,081 

3,658 

28 

0,271 

3,168 

0,222 

3,283 

0,178 

3,392 

0,138 

3,495 

0,104 

3,592 

29 

0,305 

3,107 

0,254 

3,219 

0,208 

3,327 

0,166 

3,431 

0,129 

3,528 

30 

0,337 

3,050 

0,286 

3,160 

0,238 

3,266 

0,195 

3,368 

0,156 

3,465 

31 

0,370 

2,996 

0,317 

3,103 

0,269 

3,208 

0,224 

3,309 

0,183 

3,406 

32 

0,401 

2,946 

0,349 

3,050 

0,299 

3,153 

0,253 

3,252 

0,211 

3,348 

33 

0,432 

2,899 

0,379 

3,000 

0,329 

3,100 

0,283 

3,198 

0,239 

3,293 

34 

0,462 

2,854 

0,409 

2,954 

0,359 

3,051 

0,312 

3,147 

0,267 

3,240 

35 

0,492 

2,813 

0,439 

2,910 

0,388 

3,005 

0,340 

3,099 

0,295 

3,190 

36 

0,520 

2,774 

0,467 

2,868 

0,417 

2,961 

0,369 

3,053 

0,323 

3,142 

37 

0,548 

2,738 

0,495 

2,829 

0,445 

2,920 

0,397 

3,009 

0,351 

3,097 

38 

0,575 

2,703 

0,522 

2,792 

0,472 

2,880 

0,424 

2,968 

0,378 

3,054 

39 

0,600 

2,671 

0,549 

2,757 

0,499 

2,843 

0,451 

2,929 

0,404 

3,013 

40 

0,626 

2,641 

0,575 

2,724 

0,525 

2,808 

0,477 

2,892 

0,430 

2,974 

45 

0,740 

2,512 

0,692 

2,586 

0,644 

2,659 

0,598 

2,733 

0,553 

2,807 

50 

0,836 

2,414 

0,792 

2,479 

0,747 

2,544 

0,703 

2,610 

0,660 

2,675 

55 

0,919 

2,338 

0,877 

2,396 

0,836 

2,454 

0,795 

2,512 

0,754 

2,571 

60 

0,990 

2,278 

0,951 

2,330 

0,913 

2,382 

0,874 

2,434 

0,836 

2,487 

65 

1,052 

2,229 

1,016 

2,276 

0,980 

2,323 

0,944 

2,371 

0,908 

2,419 

70 

1,105 

2,189 

1,072 

2,232 

1,038 

2,275 

1,005 

2,318 

0,971 

2,362 

75 

1,153 

2,156 

1,121 

2,195 

1,090 

2,235 

1,058 

2,275 

1,027 

2,315 

80 

1,195 

2,129 

1,165 

2,165 

1,136 

2,201 

1,106 

2,238 

1,076 

2,275 

85 

1,232 

2,105 

1,205 

2,139 

1,177 

2,172 

1,149 

2,206 

1,121 

2,241 

90 

1,266 

2,085 

1,240 

2,116 

1,213 

2,148 

1,187 

2,179 

1,160 

2,211 

95 

1,296 

2,068 

1,271 

2,097 

1,247 

2,126 

1,222 

2,156 

1,197 

2,186 

100 

1,324 

2,053 

1,301 

2,080 

1,277 

2,108 

1,253 

2,135 

1,229 

2,164 

150 

1,504 

1,972 

1,489 

1,989 

1,474 

2,006 

1,458 

2,023 

1,443 

2,040 

200 

1,599 

1,943 

1,588 

1,955 

1,576 

1,967 

1,565 

1,979 

1,554 

1,991 
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INDEX 


A 

acceptation bancaire, 90, 269 
algorithme BHHH, 305 
algorithme 

d’estimation non lineaire, 256 
d’optimisation, 149 
de Newton, 150 
de Newton-Raphson, 149 
iteratif Cochrane-Orcut, 222 
analyse factorielle, 242 
approximation 

de Taylor, 151,332 
parcimonieuse, 282 
APT (Arbitrage Pricing Theory), 228 
arbitrage, 228 
arbre binomial, 24 
ARCH-M, 95 
autocorrelation, 215 

en presence d’une variable 
dependante retardee, 225 
partielle, 234 
autocovariance, 216, 230 
autoregression, 263 

B 

BAX, 90, 269 
benchmark, 138 
beta, 92,293 
biais, 9 

de simultaneite, 183 


bootstrap, 193 

borne Cramer-Rao, 104 

bruit blanc, 183, 216 

c 

calcul stochastique, 187 
CAPM, 91, 164, 234, 287 
caps, 159 

carres residuels contraints, 113 
classe des estimateurs lineaires, 102 
CML, 288 
coefficient 

d’autocorrelation, 218 
de correlation de Pearson, 83 
de determination, 82 
de Kendall, 37 
de kurtosis, 276 
de retour vers la moyenne, 342 
de variance, 342 
R 2 ajuste, 83 
R 2 ajuste de Theil, 103 
cofacteur, 124 
cointegration, 265,268 
combinaisons rendement-risque 
optimales, 135 
conditions 

de moments, 328 
d’orthogonalite, 329, 332, 348 
contraintes lineaires sur les 
paravietres, 108 
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contrat 

a terme, 90, 272 
au comp tan t, 272 
convergence, 169 
en distribution, 171 
en moyenne quadratique, 170 
en probability, 170 
quasi sure, 171 
correlation 

de Pearson, 31 
de Spearman, 35 
non parametrique, 196 
spatiale, 215 
couche cachee, 255 
coupe instantanee, 242, 275 
courbe de Phillips, 87 
couverture d’un portefeuille de 
titres, 270 
couverture 
naive, 133 

optimale d’un bilan bancaire, 129 
covariance, 29 

entre les rendements de deux 
portefeuilles, 126 
critere 

d’Akaike, 246 
d’information d’Akaike, 156 
de selection de Schwarz, 246 
d’information de Schwartz, 156 

D 

data-fitting, 229 

days of the week effect (DOW), 161 
degres de liberte, 62 
demande de contrats au 
comptant, 112 
demande inverse, 183 
densite 

jointe, 38 
marginale, 38 
densites conditionnelles, 40 
derivation matricielle, 99,131 
determinant, 121 
detrending, 261 
Dickey-Fuller angmente, 265 


differentiation, 261 
discretisation 
d’Eule, 340 
d’Euler, 188, 342, 345 
d’une equation differentielle 
stochastique, 335 
de Milstein, 192 
de premier ordre, 340 
d’un processus stochastique, 338 
exacte, 340 

distance eucledienne, 45 
distribution 
X 2 . 62 

de Poisson, 25 
F, 67 

lognormale, 145 
uniforme, 33, 195 
diversification de portefeuille, 294 
doubles moindres carres non 
lineaires, 331 

doubles moindres carres, 179 

drift, 191, 335 

ecart quadratique moyen, 46 

ecart-type, 10 

effets asymetriques, 283 

efficience des marches financiers, 263 

efficients, 75 

E 

elasticite-prix d’une option, 86 
endogeneite, 179, 182 

ensemble de Borel, 6 
ensemble orthonormal, 235 
equation 

caracteristique, 181 
de difference, 260 
differentielle stochastique 
discretisee, 185 
normales, 72, 101 
equilibre des marches financiers, 292 
erreur 

de prevision., 82 
de suivi, 129, 138 
de type I, 66 
de type II, 66 
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erreurs 

de prevision groupees 
{clustered), 276 
de specification, 143 
espace des e'tats de la nature, 229 
espace fondamental, 229 
esperance, 29 

conditionnelle et prevision a court 
terme, 277 

conditionnelle, 259, 276 
du rendement du titre i, 241 
mathematique, 20 
non conditionnelle et prevision a 
long terme, 277 
non conditionnelle, 259 
non conditionnelle, 274,277 
risque-neutre, 192 
estimateur 

BLUE, 46,102,219 
convergent, 183 
de distance minimale, 327 
des doubles moindres carres, 331 
desMCO, 71 

des moindres carres indirects, 330 
kernel du beta, 199 
super-convergent, 268 
semi-parametriques, 334 
EViews, 15 

exces de leptokurticite, 283 
expansion de Taylor, 188 


facteurs, 236 
FGLS, 224 
filtre lineaire, 237 
finance corporative, 335 
fonction 

d’activation logistique, 256 
d’autocorrelation partielle, 234 
d’autocorrelation, 232 
d’autocovariance, 232 
de lagrange, 136,139 
de repartition, 19 
de transition, 254,257 
de vraisemblance, 50 


logistique, 255,256 
scedastique, 70 

lineaire d’heteroscedasticite, 206 
quadratique, 99, 127 
formes fonctionnelles, 83 
frontiere efficiente, 129,135 

G-H 

GARCH(1,1), 282 
GARCH, 257 
GARCH-M multivarie, 304 
generateur de variables aleatoires, 193 
GMM, 327 
gradient, 153 
heteroscedasticite, 201 
homoscedasticite, 70, 98, 203, 275 

I 

impact des jours de la semaine sur les 
indices boursiers, 227 
independance, 38 
indice de reference, 138 
instruments, 330 
integrale 

de Riemann, 29, 186 
stochastique, 187 
integration, 243 
integre', 242 

intervalle de confiance, 61 
Intervalles de confiance, 106 
migrated GARCH, 281 
inverse 

d’une matrice, 123 

generalise de Moore-Penrose, 180 

J-K 

jacobien, 49 
Jarque et Bera, 16 
jeu non biaise (fair game, 302 
kernel, 196, 348 
gaussien, 28 
Kurtosis, 14 
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L 

lemme d’lto, 187, 336 
leptokurticite, 276 
leverage effect, 283 
location model, 327 
logiciel 

Eviews, 154, 207, 228, 235, 250, 
348 

Excell, 189 
Mathematica, 193 
RATS, 279 
loi 

binomiale, 22 
lognormale, 188 
normale centree reduite, 28 
normale multivariee, 42 
normale ou gaussienne, 27 

M 

MAE (mean absolute error), 249 
marche 

aleatoire avec tendance 
stochastique, 258 
aleatoire avec tendance, 260 
aleatoire, 243, 258, 263 
aleatoire, 263 
martingale, 259 
matrice 

HAC (heteroskedastic and 

autocorrelation consistent covariance 
matrix), 348 
adjointe, 123 
conformable, 117 
d’information, 125 
de correlation de Pearson, 179 
de ponderation des moments, 347 
de transformation, 103 
de White, 207,332,348 
definie positive, 101 
diagonale de transformation, 205 
diagonale, 119 
generatrice des residus, 120 
HCCM, 332 
idempotente, 77, 120 
orthogonale, 235 


partitionnee, 124 
semi-definie positive, 348 
singuliere, 239 
symetrique, 77, 119 
transposee, 118 
triangulaire, 122 
variance-covariance d’trn 
portefeuille, 126 
variance-covariance, 42, 75 
maximum de vraisemblance, 47, 104 
mediane, 9 
methode 

classique des moments, 325 
de Box et Jenkins, 243 
de Gauss-Newton, 151 
de Prais et Winsten, 222 
des doubles moindres 
carres, 346,349 
des MCO en deux etapes, 245 
des moindres carres ordinaires, 44, 
346 

des moments generalises, 98, 179, 
327 

d’estimation GARCH-M, 287 
STAR, 254 
mineur, 124 
minimum chi-square, 327 
mode, 9 
modele 

ANN {artificial neural network), 255 
ANN, 256 
ARCH(l), 277 
ARCH(q), 280 
ARCH, 276 
ARCH-M, 282 
ARIMA (p,d,q), 242 
ARMA(1,1), 241 
ARMA(p,q), 242 
bifactoriel de taux d’interet, 342 
binomial de Cox, Ross et 
Rubinstein, 23 
classique lineaire general, 98 
contraint, 112 

de Cox, Ingersoll et Ross, 192 
de regression non lineaire 
multivarie, 153 
de Schaefer et Schwartz, 342 
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EGARCH(p,q), 283 
EGARCH, 283 
ESTAR, 255 
GARCH(1,1), 281, 284 
general GARCH(p,q), 281 
IGARCH(1,1), 281, 286 
LSTAR, 255 
STAR, 254 

stochastique bifactoriel de taux 
d’interet de Schaefer et 
Schwartz, 335 
TAR, 255 
TARCH, 284 

contraint et non contraint, 174 
moindres 

carres generalises, 205, 211 
carres non lineaires, 149,218,223, 
245 

carres ponderes, 204 
carres quasi generalises, 205 
moments 

d’une population, 326 
echantillonnaux, 326 
mouvement 

brownien avec drift, 335 
brownien generalise, 188 
brownien geometrique, 186 
brownien geometrique, 336 
browniens de taux d’interet, 341 
moyenne 

geometrique, 146 
mobile, 231 
multicolhnearite, 179 

N-O 

nombre optimal de contrats a 
terme, 133 

notation Moody’s, 250 
operateur de retard L, 230,275 
options, 335 
d’achat, 86 
de vente asiatique, 186 
de vente, 87 
sur taux d’interet, 350 
ordre d’integration, 242 
oubles moindres carres, 183 


parametre 

de lissage, 197 

de palier {thresholdparameter), 255 
portefeuille 

d’arbitrage, 236 
efficient, 296 
position 

long, 129 
short, 129 

positions au comptant et a terme, 90 
prevision, 79, 114 

a court terme d’une variable, 274 
a long terme d’une variable, 274 
a partir du modele GARCH, 284 
de court terme, 259 
en presence d’autocorrelation, 226 
MMSE, 247 

a 1’aide de modeles statistiques de 
processus de marche 
aleatoire, 258 
prime de risque, 95 
du marche, 240 
d’un facteur, 242 
principe de Parbitrage, 236 
prix 

a terme, 269 
au comptant, 269 
d’exercice, 186 

d’equilibre du titre j dans le contexte 
du modele du CAPM, 299 
du risque, 240, 288, 306 
Probability conditionnelles, 40 
probleme d’optimisation, 139 
procedure 

iterative Cochrane-Orcutt, 219 
de discretisation, 340 
processus 

ARCH(8), 282 
ARMA(p, q), 281 
autoregressif d’ordre 1, 343 

autoregressif d’ordre p, 216 
browniens de retour vers la 
moyenne, 337 

browniens de taux d’interet, 338 
d’lto, 187 
d’lto, 336 
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processus 

de marche aleatoire avec 
tendance, 258 

de moyenne mobile MA(q), 236 
de Wiener, 186, 187,336,340 
integre d’ordre 1, 242 
Omstein-Uhlenbeck, 337, 340 
stochastique non 

stationnaire, 242, 258 
stochastique, 229 
produit Kronecker, 118 
progression geometrique, 231 
pseudo-inverse, 180 
puissance, 66 
put asiatique, 189 
p-value, 66 

Q-R 

quantite de risque, 288 
racine unitaire, 262, 263 

de couverture optimal, 90 
de couverture, 272 
de la dette a l’equite, 283 
de vraisemblance, 173 
regie 

de l’Hopital, 148 
de la chalne, 291 
regresseur, 69 
regression, 69 

artificielle, 210, 287 
auxiliaire ou artificielle, 209 
auxiliaire, 180, 270 
fallacieuse ( spurious regression ), 263 

multiple, 98 
non lineaire, 149 
non parametrique, 196 
rendement, 93 

excedentaire, 240, 288 
reseaux de neurones, 254 
residus stationnaires, 268 
retrait de la tendance ( detrending ), 261 

ridge regression, 181 

diversifiable, 294 
non diversifiable, 294 


non systematique, 236, 295 
systematique, 293,295 
RMSE {root mean square error), 249 


scheme de Milstein, 341 

de Taylor du premier degre, 341 
de Taylor du second degre, 341 
DS, 267 

en coupe instantanee, 201 
en difference stationnaire, 262 
en tendance stationnaire, 262 
stationnarisee, 244 
temporelle non lineaire, 253 
temporelle, 201 
TS, 267 
cointegrees, 265 
simulation de Monte Carlo, 185 
skewness, 11 
SML, 91, 165 
solution non triviale, 239 
stationnarite, 216, 230 
de second ordre, 230 
faible, 230 
statistique 

h de Durbin, 225 
Q, 245 
TR 2 , 287 
U de Theil, 249 
structure a terme des taux 
d’interet, 153 

surparametrisation {overfitting), 245 
systeme 

d’equations exactement 
identifie, 330 
d’equations lineaires 
homogenes, 239 
suridentifie, 330, 351 

T 

taux a terme, 231 
taux au comptant, 230 
taux sans risque, 95 
technique de lissage des donnees de 
Nadaraya-Watson, 197 
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technique dite de l’equivalent- 
certain, 300 
test 

Bera-Jarque, 79 
Box-Cox, 146 

d’un changement structurel, 161 
de Breusch-Pagan, 209 
de Chen, Roll et Ross, 243 
de Chow (predictive), 165 
de Chow, 163 
de cointegration d’ Engle et 
Granger, 268 
de Dickey-Fuller, 265 
de Goldfeld et Quandt, 208 
de Kolmogorov-Smirnov, 17 
de Perron, 265 
de racine unitaire, 265 
de Wald, 175 
de White, 211 
Durbin-Watson, 224 
F, 67, 106 
J, 157 

LM d’Engle, 286 
LM, 176 
LR, 173 

Phillips-Perron, 267 
score, 176 
sur les restrictions de 
suridentification, 351 
t, 61 

bilateraux, 106 
exacts, 104 

LM, LR et Wald, 105 
non parametriques, 105 
unilateraux, 106 
theoreme 

central limite, 41, 78 
de Gauss-Markov, 46, 102 
de l’arbitrage, 233 
de Pythagore, 295 
deWold, 237 


theorie 

asymptotique, 169 
de Markowitz, 294 
des produits derives, 350 
tirage avec remise, 195 
TR 2 , 211 

d’un scalaire, 121 
d’une matrice, 120 
tracking error, 129, 138 

transformation 

de Box-Cox, 147 
en quasi-differences, 218 
jacobienne, 47, 278 

d’une serie chronologique, 260 
stochastique, 259, 264 
temporel lineaire, 261 
temporel polynomial, 261 

V 

valeur 

critique, 63 
propre, 180 
VaR, 185, 195 
variable 

aleatoire, 6 
auxiliaire, 159,227 
de transition, 254 
dichotomique, 115 
gaussienne, 341 
instrumentale, 178, 346 
deterministes, 6 
instrumentales, 329 
variance, 21, 29 
conditionnelle, 95, 201, 275 
du tracking-error, 139 
echantillonnale, 9 
non conditionnelle, 275 
caracteristique, 181 
GARCH-M multivariee du 
CAPM, 307 

vecteur orthonormal, 241 
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